什么是網(wǎng)絡爬蟲 2022-09-05
網(wǎng)絡爬蟲,英文名為Spider,又稱為網(wǎng)頁蜘蛛,網(wǎng)絡機器人,在數(shù)據(jù)分析應用中,更多的將爬蟲稱為數(shù)據(jù)采集程序,是一種按照一定的規(guī)則,自動地抓取...詳情>
2022年it行業(yè)的就業(yè)方向及前景分析 2022-09-05
在2022年it主流就業(yè)方向包括前端開發(fā)、數(shù)據(jù)庫管理、大數(shù)據(jù)開發(fā)、后臺開發(fā)、嵌入式開發(fā)、AI智能和UI設計這七大方向,每個方向所需要的技能都會...詳情>
云計算很難學嗎?工資高嗎 2022-09-05
云計算很難學嗎?工資高嗎?云計算是近幾年的熱詞,大家都在討論要不要學云計算技術。云計算技術主要學習計算機網(wǎng)絡技術、Mysql數(shù)據(jù)庫、Linux...詳情>
Hive調優(yōu)(重點) 2022-09-02
map任務數(shù)量優(yōu)化: 實際業(yè)務中往往存在大量的分區(qū)表,每個分區(qū)表都實際存儲一定量的文件,其中必然有些分區(qū)的數(shù)據(jù)量很少。詳情>
存儲格式和壓縮格式 2022-09-02
一般選擇ORC+bzip/gzip作為數(shù)據(jù)源的存儲,選擇則ORC+Snappy作為中間數(shù)據(jù)的存儲,分區(qū)表單文件不大可以采用gzip壓縮,桶表需要用bzip或lzo支持...詳情>
分區(qū)表和分桶表(重點) 2022-09-02
分區(qū)表:將數(shù)據(jù)按照分區(qū)字段拆分存儲的表,在hdfs中以文件夾的形式分別存放不同分區(qū)的數(shù)據(jù),可以避免全表查詢,提高查詢效率詳情>
內部表和外部表(重點) 2022-09-02
hive外部表是使用external關鍵字并指定一個hdfs目錄創(chuàng)建的表。hive內部表在創(chuàng)建時會在對應hive目錄下創(chuàng)建相應的文件夾,外部表則以指定文件夾...詳情>
CTAS查詢建表 2022-09-02
CREATE [TEMPORARY,EXTERNAL] TABLE [if not exist] [db_name.]name [ROW FORMAT row_format] [STORED AS file_format] AS select_statement ...詳情>
html5新增標簽有哪些?新增常用標簽整理 2022-09-02
html5隨著多年的發(fā)展,現(xiàn)在已經(jīng)發(fā)展成為最重要的標記語言。隨著該語言的不斷完善,會新增一些標簽,那么html5新增標簽有哪些呢?html5新增標簽...詳情>
如何剪輯短視頻?六個步驟教你輕松操作 2022-09-02
在視頻制作的過程中,有很多重要的步驟起著至關重要的作用。例如定位、腳本、剪輯技巧等。在我們短視頻運營的過程中,如何剪輯短視頻是很多新...詳情>
熱問標簽 更多>>
在線提問
專業(yè)導師線上坐鎮(zhèn),解答個性化學習難題
提交問題