校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃

主頁 > 知識庫 > pandas數據處理之 標簽列字符轉數字的實現

pandas數據處理之 標簽列字符轉數字的實現

熱門標簽:ai地圖標注 n400電話申請多少錢 如何在地圖標注文字 女王谷地圖標注 廈門crm外呼系統如何 地圖標注推廣單頁 長春人工智能電銷機器人官網 西藏快速地圖標注地點 百應ai電銷機器人鄭州

機器學習中,當我們在進行數據預處理的時候,對于標簽列非字符的數據,我們往往需要將其轉換成字符,因為有的算法可能不支持非數字類型來做特征。

那么怎么快捷地來著這個轉換呢,請看我的示例:

1.構建測試數據

import pandas as pd
array = ['good','bad','well','bad','good','good','well','good']

2.數據轉換下,并獲取標簽列的字典

df = pd.DataFrame(array,columns=['status'])
status_dict = df['status'].unique().tolist()

3.使用函數進行轉換

df['transfromed']=df['status'].apply(lambda x : status_dict.index(x))

這樣,就將標簽列處理好了哈

等用完之后,再轉回來

df['transfromed1']= df['transfromed'].apply(lambda x : status_dict[x])

補充:pandas factorize將字符串特征轉化為數字特征

將原始數據中的字符串特征轉化為模型可以識別的數字特征可是使用pandas自帶的factorzie方法。

原始數據的job特征值如下

都是字符串特征,無法用于訓練,當然可以單獨建立map硬編碼處理,但是pandas已經封裝好了相應的方法。

data = pd.read_csv("data/test_set.csv")
data["job"] = pd.factorize(data["job"])[0].astype(np.uint16)

以上為個人經驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。

您可能感興趣的文章:
  • pandas 對每一列數據進行標準化的方法
  • pandas數據處理進階詳解
  • Pandas 數據處理,數據清洗詳解
  • 使用pandas模塊實現數據的標準化操作

標簽:內江 拉薩 興安盟 廊坊 亳州 綿陽 黔東 渭南

巨人網絡通訊聲明:本文標題《pandas數據處理之 標簽列字符轉數字的實現》,本文關鍵詞  pandas,數據處理,之,標簽,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《pandas數據處理之 標簽列字符轉數字的實現》相關的同類信息!
  • 本頁收集關于pandas數據處理之 標簽列字符轉數字的實現的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 卓尼县| 仲巴县| 大竹县| 图片| 延吉市| 双桥区| 凤庆县| 紫云| 宜宾市| 哈巴河县| 阜城县| 抚顺县| 巴林左旗| 大足县| 龙泉市| 梅河口市| 兰坪| 古田县| 丰都县| 怀来县| 睢宁县| 金塔县| 静安区| 临西县| 龙里县| 长葛市| 广西| 庆云县| 弥勒县| 怀安县| 全州县| 新宁县| 广昌县| 商河县| 固阳县| 武鸣县| 西林县| 大名县| 蒲城县| 钟祥市| 桑日县|