前端之家收集整理的这篇文章主要介绍了
了解Drill Sandbox《译》,
前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
<table class="text"><tr class="li1">
<td class="ln"><pre class="de1">1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
在本教程中,您
查询的数据集,
包括hive和HBase和在
文件系统中的
文件,例如CSV、JSON、Parquet等
文件。去访问这些不同的数据源,你连接钻到存储
插件。
存储
插件概述
你使用存储
插件连接到一个数据源,如
文件或Hive元存储。看看存储
插件通过打开存储在钻Web控制台定义
标签。启动一个web浏览器并去:http://
:8047/storage.
控制面板来管理存储插件出现。
你看到下面的存储插件配置:
cp
dfs
蜂巢
maprdb
hbase
蒙戈
单击更新检查配置。
如果你使用一个安装钻在使用沙箱之前,你可能会注意到,几个存储插件配置在沙箱不同于相同的存储在钻机安装插件配置。 dfs的沙箱配置,蜂巢,maprdb和hbase存储插件定义在模拟运行的集群环境中发挥作用的教程。
dfs
的 dfs
存储插件沙箱MapR的连接配置文件系统(MapR-FS)。
的 dfs
存储在沙箱中还包含一组插件配置的工作区;每一个代表 在MapR-FS位置:
根:根文件系统访问的位置
点击:访问日志嵌套的JSON数据
日志:平(non-nested)访问JSON日志数据的日志目录及其子目录
视图:一个工作区创建视图
的 dfs
配置包括格式定义。
{
"type": "file", "enabled": true, "connection": "maprfs:///", "workspaces": {
"root": {
"location": "/mapr/demo.mapr.com/data", "writable": false, "defaultInputFormat": null
}, "clicks": {
"location": "/mapr/demo.mapr.com/data/nested", "writable": true, "defaultInputFormat": "parquet"
}, . . .
"formats": {
. . .
"csv": {
"type": "text", "extensions": [
"csv"
], "delimiter": ","
}, . . .
"json": {
"type": "json"
}, "maprdb": {
"type": "maprdb"
}
. . .
maprdb
maprdb是配置MapR-DB沙箱。 你使用这种格式在沙箱查询MapR-DB / HBase表。
蜂巢
蜂巢的蜂巢配置数据仓库在沙箱内。 钻连接到蜂巢Metastore通过使用配置Metastore节俭 URI。 蜂巢的元数据表自动供用户查询。
{
"type": "hive", "configProps": {
"hive.Metastore.uris": "thrift://localhost:9083", "hive.Metastore.sasl.enabled": "false"
}
}
不要使用这个存储插件配置在沙箱之外。 使用的配置 远程或嵌入式Metastore配置 。
接下来是什么
开始去查询 教训1:了解数据 集 。