亚洲欧洲国产欧美一区精品,激情五月亚洲色五月,最新精品国偷自产在线婷婷,欧美婷婷丁香五月天社区

      python

      當前位置:中華考試網(wǎng) >> python >> python編程基礎(chǔ) >> 文章內(nèi)容

      Python數(shù)據(jù)挖掘怎么進行預處理?

      來源:中華考試網(wǎng)  [2020年11月13日]  【

        我們既然進行數(shù)據(jù)挖掘,那就肯定和數(shù)據(jù)要做到一定關(guān)系,比如我們先要去了解數(shù)據(jù),在對數(shù)據(jù)進行分析,然后處理等等,那這個過程是需要去操作實現(xiàn)的,我們在使用Python的時候要怎么去處理這些內(nèi)容呢?下面給大家整理了相關(guān)流程,讓大家可以快速處理數(shù)據(jù)。

        Python數(shù)據(jù)預處理實戰(zhàn)

        常見的數(shù)據(jù)預處理方法如下內(nèi)容:

        1、缺失值處理

        缺失值是指在一組數(shù)據(jù)中,某行數(shù)據(jù)缺失的某個特征值。

        2、異常值處理

        異常值產(chǎn)生的原因往往是數(shù)據(jù)在采集時發(fā)生了錯誤,如在采集數(shù)字68時發(fā)生了錯誤,誤將其采集成680。

        填寫下面表單即可預約申請免費試聽java課程!害怕學不會?助教全程陪讀,隨時解惑!擔心就業(yè)?一地學習,可全國推薦就業(yè)!

      預約申請免費聽java課程

      • 地區(qū):
      • 姓名:
      • 手機:

        3、數(shù)據(jù)集成

        相較于上文的缺失值處理和異常值處理,數(shù)據(jù)集成是一種較為簡單的數(shù)據(jù)預處理方式。

        接下來以淘寶商品數(shù)據(jù)為例,介紹一下上文預處理的實戰(zhàn)。

        在進行數(shù)據(jù)預處理之前,首先需要從MySQL數(shù)據(jù)庫中導入淘寶商品數(shù)據(jù)。在開啟MySQL數(shù)據(jù)庫之后,對其中的taob表進行查詢,得到了如下的輸出:

        可以看到,taob表中有四個字段。其中title字段用于存儲淘寶商品的名稱;link字段存儲淘寶商品的鏈接;price存儲淘寶商品的價格;comment存儲淘寶商品的評論數(shù)(一定程度上代表商品的銷量)。

        通過pymysql連接數(shù)據(jù)庫(如果出現(xiàn)亂碼,則對pymysql的源碼進行修改),連接成功后,將taob中的數(shù)據(jù)全部檢索出來,然后借助pandas中的read_sql()方法便可以將數(shù)據(jù)導入到內(nèi)存中。

      責編:fushihao

      上一篇:Python3編碼如何實現(xiàn)文件操作?

      下一篇: 沒有了

      • 會計考試
      • 建筑工程
      • 職業(yè)資格
      • 醫(yī)藥考試
      • 外語考試
      • 學歷考試