教育行業(yè)A股IPO第一股(股票代碼 003032)

全國咨詢/投訴熱線:400-618-4000

全部 Python+大數(shù)據(jù)新聞動態(tài) Python+大數(shù)據(jù)技術(shù)文章 Python+大數(shù)據(jù)學(xué)習(xí)常見問題 技術(shù)問答

    • 初始ETL:ETL的體系結(jié)構(gòu)

      ETL主要是用來實(shí)現(xiàn)異構(gòu)數(shù)據(jù)源數(shù)據(jù)集成的。多種數(shù)據(jù)源的所有原始數(shù)據(jù)大部分未作修改就被載入ETL,因而,無論數(shù)據(jù)源在關(guān)系型數(shù)據(jù)庫、非關(guān)系型數(shù)據(jù)庫,還是在外部文件,集成后的數(shù)據(jù)都將被置于數(shù)據(jù)庫的數(shù)據(jù)表或數(shù)據(jù)倉庫的維度表中,以便在數(shù)據(jù)庫內(nèi)或數(shù)據(jù)倉庫中作進(jìn)一步轉(zhuǎn)換(因此,一般會將最終的數(shù)據(jù)存儲到數(shù)據(jù)庫或者數(shù)據(jù)倉庫中)。 查看全文>>

      Python+大數(shù)據(jù)學(xué)習(xí)常見問題2022-11-10 |傳智教育 |初始ETL,ETL的體系結(jié)構(gòu)

    • 基本數(shù)據(jù)統(tǒng)計分析:漏斗分析是什么意思?

      漏斗分析通過定義有序的過程環(huán)節(jié)和步驟,分析不同步驟之間的轉(zhuǎn)化過程,而由于后續(xù)的轉(zhuǎn)化一般都會比前面的轉(zhuǎn)化數(shù)量更少,因此會形成類似于漏斗的形狀。漏斗分析是網(wǎng)站分析的基本方法,很多強(qiáng)大的工具支持全站頁面、事件、目標(biāo)之間的混合漏斗分析,通過漏斗查看特定目標(biāo)的完成和流失情況。 查看全文>>

      Python+大數(shù)據(jù)學(xué)習(xí)常見問題2022-11-09 |傳智教育 |漏斗分析,基本數(shù)據(jù)統(tǒng)計分析

    • Serde是什么?常用的自定義Serde和內(nèi)置Serde

      Serde是Serializer and Deserializer(序列化和反序列化)的簡稱,Hive 通過Serde處理Hive數(shù)據(jù)表中每一行數(shù)據(jù)的讀取和寫入,例如查詢Hive數(shù)據(jù)表數(shù)據(jù)時,HDFS中存放的數(shù)據(jù)表數(shù)據(jù)會通過Serializer序列化為字節(jié)流便于數(shù)據(jù)傳輸;向Hive數(shù)據(jù)表插入數(shù)據(jù)時,會通過Deserializer將數(shù)據(jù)反序列化成Hive數(shù)據(jù)表的每一行值,方便將數(shù)據(jù)加載到數(shù)據(jù)表中,不需要對數(shù)據(jù)進(jìn)行轉(zhuǎn)換。 查看全文>>

      Python+大數(shù)據(jù)學(xué)習(xí)常見問題2022-11-08 |傳智教育 |Serde表屬性,Serde是什么

    • Hive的工作原理是什么?Hive和Hadoop執(zhí)行任務(wù)的流程

      Hive是基于Hadoop的一個數(shù)據(jù)倉庫工具,主要用來對數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、加載操作。HiveQL可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射為一張數(shù)據(jù)表,允許熟悉SQL的用戶查詢數(shù)據(jù),也允許熟悉MapReduce的開發(fā)者開發(fā)自定義的mapper和reducer來處理內(nèi)建的mapper和 reducer無法完成的復(fù)雜的分析工作,相對于Java代碼編寫的MapReduce來說,Hive的優(yōu)勢更加明顯。Hive利用Hadoop的HDFS存儲數(shù)據(jù),利用Hadoop的MapReduce執(zhí)行查詢。 查看全文>>

      Python+大數(shù)據(jù)技術(shù)文章2022-11-08 |傳智教育 |Hive和Hadoop協(xié)作執(zhí)行任務(wù)的工作原理

    • Python文本數(shù)據(jù)分析:NLTK與jieba概述

      NLTK全稱為Natural Language Toolkit,它是一套基于Python的自然語言處理工具包,可以方便地完成自然語言處理的任務(wù),包括分詞、詞性標(biāo)注、命名實(shí)體識別(NER)及句法分析等。 查看全文>>

      Python+大數(shù)據(jù)學(xué)習(xí)常見問題2022-11-08 |傳智教育 |Python文本數(shù)據(jù)分析,NLTK與jieba概述

    • Python中怎樣選擇正確的可視化圖表?

      數(shù)據(jù)可視化專家基于以上4種關(guān)系對圖表的選擇思路進(jìn)行了總結(jié),引導(dǎo)用戶逐步明確需求,從而幫助用戶快速且正確地選擇圖表。下面分別介紹基于比較、分布、構(gòu)成和聯(lián)系關(guān)系的數(shù)據(jù)可選擇的圖表,具體內(nèi)容如下。 查看全文>>

      Python+大數(shù)據(jù)技術(shù)文章2022-11-07 |傳智教育 |可視化圖表,python數(shù)據(jù)分析

    • Python數(shù)據(jù)預(yù)處理:dropna()函數(shù)的用法講解

      在Python中,我們可以通過dropna()方法來刪除含有空值或缺失值的行或列,其語法格式如下。 查看全文>>

      Python+大數(shù)據(jù)學(xué)習(xí)常見問題2022-11-04 |傳智教育 |dropna()函數(shù)的用法,數(shù)據(jù)預(yù)處理

    • 數(shù)據(jù)分析工具Pandas:常用的統(tǒng)計計算

      Pandas為我們提供了非常多的描述性統(tǒng)計分析的指標(biāo)方法,比如總和、均值、最小值、最大值等。接下來,筆者來羅列一些常用的描述性統(tǒng)計方法,以及它們的具體說明。 查看全文>>

      Python+大數(shù)據(jù)學(xué)習(xí)常見問題2022-11-02 |傳智教育 |Pandas工具,統(tǒng)計計算

    << < 1 ... 44 45 46 47 48 49 50 ... 159 > >>
和我們在線交談!