色综合老司机第九色激情 _中文字幕日韩av资源站_国产+人+亚洲_久久久精品影院_久久久视频免费观看_欧美激情亚洲自拍_亚洲成av人片在线观看香蕉_热草久综合在线_欧美极品第一页_2020国产精品自拍

千鋒教育-做有情懷、有良心、有品質的職業教育機構

手機站
千鋒教育

千鋒學習站 | 隨時隨地免費學

千鋒教育

掃一掃進入千鋒手機站

領取全套視頻
千鋒教育

關注千鋒學習站小程序
隨時隨地免費學習課程

當前位置:首頁  >  技術干貨  > 大數據面試題:經典面試題答疑(三)

大數據面試題:經典面試題答疑(三)

來源:千鋒教育
發布人:syq
時間: 2022-06-08 16:27:00 1654676820

  大數據經典面試題答疑---經常問的原理問題總結(系列文章,持續更新),幫你解決大數據開發中的困擾。

  1. hive+MapReduce

  答案區:

  1. hive+MapReduce

  Hive不支持行級數據的插入、更新和刪除,也不支持事務操作;

  1.1. MapReduce的join過程

wpsovWTMc

  (1):利用DistributedCache將小表分發到各個節點上,在Map過程的setup()函數里,讀取緩存里的文件,只將小表的連接鍵存儲在hashSet中。

  (2):在map()函數執行時,對每一條數據進行判斷(包含小表數據),如果這條數據的連接鍵為空或者在hashSet里不存在,那么則認為這條數據無效,這條數據也不參與reduce的過程。

  1.2. hive的SQL解析過程

01

  詞法、語法解析: Antlr 定義 SQL 的語法規則,完成 SQL 詞法,語法解析,將 SQL 轉化為抽象語法樹 AST Tree;

  語義解析: 遍歷 AST Tree(抽象語法樹,抽象語法結構的樹狀),抽象出查詢的基本組成單元 QueryBlock;

  生成邏輯執行計劃: 遍歷 QueryBlock,翻譯為執行操作樹 OperatorTree;

  優化邏輯執行計劃: 邏輯層優化器進行 OperatorTree 變換,合并 Operator,達到減少 MapReduce Job,減少數據傳輸及 shuffle 數據量;

  生成物理執行計劃: 遍歷 OperatorTree,翻譯為 MapReduce 任務;

  優化物理執行計劃: 物理層優化器進行 MapReduce 任務的變換,生成最終的執行計劃。

  1.3. hive數據導入

  load data inpath '/hadoop/guozy/data/user.txt' into table external_table;

  此處是移動(非復制),移動數據非常快,不會對數據是否符合定義的Schema做校驗,這個工作通常在讀取的時候進行(即Schema on Read)

  1.4. 內部表與外部表的不同

  1.創建外部表需要添加 external 字段。而內部表不需要。

  2.刪除外部表時,HDFS中的數據文件不會一起被刪除。而刪除內部表時,表數據及HDFS中的數據文件都會被刪除。

  3.內部表與外部表如果不指定location,默認使用hive.metastore.warehouse.dir指定的路徑

  1.5. 分區和分桶

  1.5.1. 分區

  指的就是將數據按照表中的某一個字段進行統一歸類,并存儲在表中的不同的位置,也就是說,一個分區就是一類,這一類的數據對應到hdfs存儲上就是對應一個目錄。

  1.5.1.1. 靜態分區

  數據已經按某些字段分完區放在一塊,建表時直接指定分區即可。

  create table enter_country_people(id int,name string,cardNum string)

  partitioned by (enter_date string,country string);

  注意,這里的分區字段不能包含在表定義字段中,因為在向表中load數據的時候,需要手動指定該字段的值.

  數據加載(指定分區):

  load data inpath '/hadoop/guozy/data/enter__china_people' into table enter_country_people partition (enter_date='2019-01-02',country='china');

  此處自動創建分區目錄;

  創建完后目錄結構:

wpsdJ7hIU

  其他創建分區目錄的方法:

  1.alter table enter_country_people add if not exists partition (enter_date='2019-01-03',country='US');

  2.在相應的表目錄下創建分區目錄后,執行 msck repair table table_name;

  1.5.1.2. 動態分區

  建表相同,主要是加載數據方式不同,動態分區是將大雜燴數據自動加載到不同分區目錄。

  1.開啟非嚴格模式

  2.需要從另一張hive表查詢

  set hive.exec.dynamic.partition.mode=nonstrict;

  insert into table enter_country_people(user string,age int) partition(enter_date,country) select user,age,enter_date,country from enter_country_people_bak;

  1.5.2. 分桶表

  如果兩個表根據相同的字段進行分桶,則在對這兩個表進行關聯的時候可以使用map-side關聯高效實現。

  create table user_bucket(id int comment 'ID',name string comment '姓名',age int comment '年齡') comment '測試分桶' clustered by (id) sorted by (id) into 4 buckets row format delimited fields terminated by '\t';

  指定根據id字段進行分桶,并且分為4個桶,并且每個桶內按照id字段升序排序,如果不加sorted by,則桶內不經過排序的,上述語句中為id,根據id進行hash之后在對分桶數量4進行取余來決定該數據存放在哪個桶中,因此每個桶都是整體數據的隨機抽樣。

  數據載入:

  我們需要借助一個中間表,先將數據load到中間表中,然后通過insert的方式來向分桶表中載入數據。

  create table tmp_table (id int comment 'ID',name string comment '名字',age int comment '年齡') comment '測試分桶中間表' ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' ;

  load data inpath '/hadoop/guoxb/data/user.txt' into table tmp_table;

  insert into user_bucket select * from tmp_table;

  上述的語句中,最終會在hdfs上生成四個文件,而不是四個目錄,如果當在次向該分桶表中insert數據后,會又增加4個文件,而不是在原來的文件上進行追加。

  1.5.3. 區別

  1.hdfs目錄結構不同,分區是生成目錄,分桶是生成文件

  2.分區表在加載數據的時候可以指定加載某一部分數據,有利于查詢

  3.分桶在map-side join(另一種 reduce-side join)查詢時,可以直接從bucket(兩表分桶成倍數即可)中提取數據進行關聯操作,查詢高效。

  1.6. Sort By、Order By、Cluster By,Distribute By,group by

  order by:會對輸入做全局排序,因此***\*只有一個reducer\****(多個reducer無法保證全局有序)。只有一個reducer,會導致當輸入規模較大時,需要較長的計算時間。

  distribute by:按照指定的字段對數據進行劃分輸出到不同的reduce中(單純的分散數據)。

  sort by:局部排序,sort by只是確保每個reduce上面輸出的數據有序,當只有一個reduce時,也變成全局排序。

wpsq0kGDl

  cluster by:當distribute by 和 sort by 所指定的字段相同時,即可以使用cluster by

  group By Key算子的功能固定,只能輸出相同key值的序列,reduceByKey適用于分組排序過程中有數據聚合操作(sum)的情形,在其他場景下可能不適用。

wpsnkIWGq

  受限于reduce數量,設置reduce參數mapred.reduce.tasks 輸出文件個數與reduce數相同,文件大小與reduce處理的數據量有關,網絡負載過重 數據傾斜,優化參數hive.groupby.skewindata為true,會啟動一個優化程序,避免數據傾斜

  1.7. SQL

  1.7.1. 開窗函數

wpsgOGnKY

  1.8. 數據傾斜怎么解決

  1.key 盡量打亂;提高reduce任務數

  2.關聯查詢時,利用分桶和map-side提高查詢效率

  1.9. 星型模型和雪花模型介紹

  星型模型:所有的維表直接連接到事實表:

02

  雪花模型:

  當有一個或多個維表沒有直接連接到事實表上,而是通過其他維表連接到事實表上時,是星型模型的拓展。

03

  更多關于大數據培訓的問題,歡迎咨詢千鋒教育在線名師。千鋒教育擁有多年IT培訓服務經驗,采用全程面授高品質、高體驗培養模式,擁有國內一體化教學管理及學員服務,助力更多學員實現高薪夢想。

tags:
聲明:本站稿件版權均屬千鋒教育所有,未經許可不得擅自轉載。
10年以上業內強師集結,手把手帶你蛻變精英
請您保持通訊暢通,專屬學習老師24小時內將與您1V1溝通
免費領取
今日已有369人領取成功
劉同學 138****2860 剛剛成功領取
王同學 131****2015 剛剛成功領取
張同學 133****4652 剛剛成功領取
李同學 135****8607 剛剛成功領取
楊同學 132****5667 剛剛成功領取
岳同學 134****6652 剛剛成功領取
梁同學 157****2950 剛剛成功領取
劉同學 189****1015 剛剛成功領取
張同學 155****4678 剛剛成功領取
鄒同學 139****2907 剛剛成功領取
董同學 138****2867 剛剛成功領取
周同學 136****3602 剛剛成功領取
相關推薦HOT
色综合老司机第九色激情 _中文字幕日韩av资源站_国产+人+亚洲_久久久精品影院_久久久视频免费观看_欧美激情亚洲自拍_亚洲成av人片在线观看香蕉_热草久综合在线_欧美极品第一页_2020国产精品自拍
免费av网站大全久久| 在线免费观看日本一区| 国产精品亚洲综合一区在线观看| 成人高清视频在线观看| 国产亚洲综合色| 国产一区二区三区免费在线观看| 国产一区二区导航在线播放| 91精品欧美综合在线观看最新| 一区二区三区在线播| 国产一区视频在线看| 久久久久久亚洲综合影院红桃| 精品亚洲欧美一区| 欧美大片在线观看一区二区| 亚洲视频香蕉人妖| 欧美日韩中文精品| 亚洲精品成人悠悠色影视| 欧美视频中文一区二区三区在线观看| 亚洲视频在线一区| 日韩欧美二区三区| 色婷婷激情一区二区三区| 看电影不卡的网站| 亚洲视频网在线直播| 日韩欧美区一区二| 色狠狠av一区二区三区| 国产精品系列在线观看| 午夜成人免费视频| 亚洲欧洲日韩综合一区二区| 国产一区二区0| 亚洲国产成人在线| 亚洲v中文字幕| 欧美韩国日本一区| 欧美精品一区二区三区蜜桃视频 | 91久久精品一区二区三| 国产精品色哟哟| 欧美国产成人精品| 久久综合视频网| 欧美亚洲一区二区在线观看| 91免费观看视频| 色八戒一区二区三区| www.欧美.com| 91亚洲永久精品| 91麻豆成人久久精品二区三区| 成人性生交大片免费看在线播放| 国产福利一区二区| 成人av第一页| 欧美精品在线观看一区二区| 欧美一级在线视频| 国产日韩欧美不卡| 国产亚洲欧美日韩日本| 欧美亚洲一区三区| 精品影视av免费| 国产一区二区美女诱惑| 欧美日韩视频在线一区二区| 日韩欧美一级在线播放| 成人欧美一区二区三区白人| 一区二区三区四区五区视频在线观看| 久久色.com| 日本伊人午夜精品| 波多野结衣在线一区| 91精品久久久久久久99蜜桃| 日韩欧美国产电影| 日日摸夜夜添夜夜添国产精品| 国产一区二区伦理| 欧美一级生活片| 午夜视黄欧洲亚洲| 色综合天天在线| 综合激情网...| 成人午夜伦理影院| 国产精品无人区| 高清国产午夜精品久久久久久| 91精品国产综合久久精品app| 亚洲国产另类精品专区| 在线视频一区二区免费| 亚洲激情五月婷婷| 日韩午夜在线影院| 成人免费视频视频| 欧洲视频一区二区| 亚洲日本电影在线| 成人av手机在线观看| 久久久久久99精品| 成人av网站免费观看| 中文字幕第一区二区| av激情综合网| 日韩欧美中文字幕精品| 日本怡春院一区二区| 精品国产乱码久久久久久图片| 久久av老司机精品网站导航| 精品福利视频一区二区三区| 国产剧情在线观看一区二区| 亚洲三级在线免费观看| 日韩一区二区三区四区五区六区| 久久99国产精品久久99| 一区在线观看视频| 精品国产乱码久久久久久1区2区| 成人av影院在线| 日韩av一区二区在线影视| 国产日韩欧美不卡在线| 欧美一级高清片在线观看| 不卡电影一区二区三区| 麻豆成人av在线| 亚洲综合在线第一页| 丁香婷婷综合激情五月色| 欧美一级片在线| 欧美亚洲日本国产| 国产寡妇亲子伦一区二区| 日日噜噜夜夜狠狠视频欧美人| 国产精品女上位| 久久综合国产精品| 在线播放国产精品二区一二区四区 | 99久久99久久精品免费看蜜桃 | 色视频一区二区| 日本亚洲电影天堂| 亚洲成人一区二区在线观看| 26uuu亚洲综合色欧美| 欧美一区二区啪啪| 日韩精品中文字幕在线一区| 欧美专区日韩专区| 色呦呦国产精品| 91污片在线观看| 91免费在线视频观看| 奇米777欧美一区二区| 久久狠狠亚洲综合| 黄一区二区三区| 日产国产欧美视频一区精品| 国产精品一二三四| 玖玖九九国产精品| 91久久久免费一区二区| 从欧美一区二区三区| 91丨九色丨黑人外教| 欧美性感一区二区三区| 欧美精品一区男女天堂| 亚洲欧美日韩国产另类专区 | 精品久久久久久久久久久久包黑料 | 91精品国产综合久久福利软件 | 欧美在线制服丝袜| 精品国产亚洲在线| 亚洲色图一区二区| 国产一区二区毛片| 韩国一区二区在线观看| 久久久精品国产免费观看同学| 欧美久久免费观看| 欧美国产禁国产网站cc| 亚洲国产精品久久艾草纯爱 | 国产亚洲女人久久久久毛片| 夜夜操天天操亚洲| 无码av免费一区二区三区试看| 粉嫩13p一区二区三区| 在线观看日韩电影| 亚洲资源中文字幕| 成人黄色一级视频| 欧美大片在线观看| 国产精品一区一区| 欧美日韩色一区| 男男视频亚洲欧美| 精品蜜桃在线看| 国产一区二区三区免费播放| 欧美电影一区二区三区| 蜜桃视频一区二区| 欧美日韩免费一区二区三区 | 中文字幕亚洲成人| 91在线视频免费观看| 国产精品久久久久影院色老大| 97国产精品videossex| 亚洲国产aⅴ成人精品无吗| 欧美日韩免费视频| 久久99精品久久久久久久久久久久| 欧美成人精品1314www| 国产成人综合在线观看| 精品乱人伦小说| 在线观看www91| 成人久久视频在线观看| 久久品道一品道久久精品| 成人免费电影视频| 午夜日韩在线观看| 亚洲裸体在线观看| 国产亚洲一区二区在线观看| 91国偷自产一区二区三区成为亚洲经典| 久久久亚洲精品一区二区三区 | 亚洲人亚洲人成电影网站色| 欧美图片一区二区三区| 国产精品香蕉一区二区三区| 26uuu亚洲综合色| 91精品国产综合久久久久久| 三级影片在线观看欧美日韩一区二区 | 亚洲自拍偷拍麻豆| 亚洲精品亚洲人成人网| 中文字幕一区二区三区四区| 日韩一区二区三区av| 在线成人免费观看| 欧美另类一区二区三区| 538在线一区二区精品国产| 精品视频一区 二区 三区| 欧美亚洲综合另类| 欧美少妇性性性| 91在线视频在线| 99精品在线观看视频| 色综合久久久网| 91精品国产色综合久久久蜜香臀| 欧美区一区二区三区| 欧美成va人片在线观看|