校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃

主頁(yè) > 知識(shí)庫(kù) > 詳解pandas apply 并行處理的幾種方法

詳解pandas apply 并行處理的幾種方法

熱門標(biāo)簽:深圳網(wǎng)絡(luò)外呼系統(tǒng)代理商 鎮(zhèn)江人工外呼系統(tǒng)供應(yīng)商 柳州正規(guī)電銷機(jī)器人收費(fèi) 千呼ai電話機(jī)器人免費(fèi) 申請(qǐng)辦個(gè)400電話號(hào)碼 外呼系統(tǒng)前面有錄音播放嗎 高德地圖標(biāo)注字母 400電話辦理費(fèi)用收費(fèi) 騰訊地圖標(biāo)注有什么版本

1. pandarallel (pip install )

對(duì)于一個(gè)帶有Pandas DataFrame df的簡(jiǎn)單用例和一個(gè)應(yīng)用func的函數(shù),只需用parallel_apply替換經(jīng)典的apply。

from pandarallel import pandarallel
 
# Initialization
pandarallel.initialize()
 
# Standard pandas apply
df.apply(func)
 
# Parallel apply
df.parallel_apply(func)

注意,如果不想并行化計(jì)算,仍然可以使用經(jīng)典的apply方法。

另外可以通過在initialize函數(shù)中傳遞progress_bar=True來(lái)顯示每個(gè)工作CPU的一個(gè)進(jìn)度條。

2. joblib (pip install )

 https://pypi.python.org/pypi/joblib

# Embarrassingly parallel helper: to make it easy to write readable parallel code and debug it quickly
 
from math import sqrt
from joblib import Parallel, delayed
 
def test():
  start = time.time()
  result1 = Parallel(n_jobs=1)(delayed(sqrt)(i**2) for i in range(10000))
  end = time.time()
  print(end-start)
  result2 = Parallel(n_jobs=8)(delayed(sqrt)(i**2) for i in range(10000))
  end2 = time.time()
  print(end2-end)

-------輸出結(jié)果----------

0.4434356689453125
0.6346755027770996

3. multiprocessing

import multiprocessing as mp
 
with mp.Pool(mp.cpu_count()) as pool:
  df['newcol'] = pool.map(f, df['col'])
multiprocessing.cpu_count()

返回系統(tǒng)的CPU數(shù)量。

該數(shù)量不同于當(dāng)前進(jìn)程可以使用的CPU數(shù)量。可用的CPU數(shù)量可以由 len(os.sched_getaffinity(0)) 方法獲得。

可能引發(fā) NotImplementedError 。

參見os.cpu_count()

4. 幾種方法性能比較

(1)代碼

import sys
import time
import pandas as pd
import multiprocessing as mp
from joblib import Parallel, delayed
from pandarallel import pandarallel
from tqdm import tqdm, tqdm_notebook
 
 
def get_url_len(url):
  url_list = url.split(".")
  time.sleep(0.01) # 休眠0.01秒
  return len(url_list)
 
def test1(data):
  """
  不進(jìn)行任何優(yōu)化
  """
  start = time.time()
  data['len'] = data['url'].apply(get_url_len)
  end = time.time()
  cost_time = end - start
  res = sum(data['len'])
  print("res:{}, cost time:{}".format(res, cost_time))
 
def test_mp(data):
  """
  采用mp優(yōu)化
  """
  start = time.time()
  with mp.Pool(mp.cpu_count()) as pool:
    data['len'] = pool.map(get_url_len, data['url'])
  end = time.time()
  cost_time = end - start
  res = sum(data['len'])
  print("test_mp \t res:{}, cost time:{}".format(res, cost_time))
 
def test_pandarallel(data):
  """
  采用pandarallel優(yōu)化
  """
  start = time.time()
  pandarallel.initialize()
  data['len'] = data['url'].parallel_apply(get_url_len)
  end = time.time()
  cost_time = end - start
  res = sum(data['len'])
  print("test_pandarallel \t res:{}, cost time:{}".format(res, cost_time))
 
 
def test_delayed(data):
  """
  采用delayed優(yōu)化
  """
  def key_func(subset):
    subset["len"] = subset["url"].apply(get_url_len)
    return subset
 
  start = time.time()
  data_grouped = data.groupby(data.index)
  # data_grouped 是一個(gè)可迭代的對(duì)象,那么就可以使用 tqdm 來(lái)可視化進(jìn)度條
  results = Parallel(n_jobs=8)(delayed(key_func)(group) for name, group in tqdm(data_grouped))
  data = pd.concat(results)
  end = time.time()
  cost_time = end - start
  res = sum(data['len'])
  print("test_delayed \t res:{}, cost time:{}".format(res, cost_time))
 
 
if __name__ == '__main__':
  
  columns = ['title', 'url', 'pub_old', 'pub_new']
  temp = pd.read_csv("./input.csv", names=columns, nrows=10000)
  data = temp
  """
  for i in range(99):
    data = data.append(temp)
  """
  print(len(data))
  """
  test1(data)
  test_mp(data)
  test_pandarallel(data)
  """
  test_delayed(data)

(2) 結(jié)果輸出

1k
res:4338, cost time:0.0018074512481689453
test_mp   res:4338, cost time:0.2626469135284424
test_pandarallel   res:4338, cost time:0.3467681407928467
 
1w
res:42936, cost time:0.008773326873779297
test_mp   res:42936, cost time:0.26111721992492676
test_pandarallel   res:42936, cost time:0.33237743377685547
 
10w
res:426742, cost time:0.07944369316101074
test_mp   res:426742, cost time:0.294996976852417
test_pandarallel   res:426742, cost time:0.39208269119262695
 
100w
res:4267420, cost time:0.8074917793273926
test_mp   res:4267420, cost time:0.9741342067718506
test_pandarallel   res:4267420, cost time:0.6779992580413818
 
1000w
res:42674200, cost time:8.027287006378174
test_mp   res:42674200, cost time:7.751036882400513
test_pandarallel   res:42674200, cost time:4.404983282089233

在get_url_len函數(shù)里加個(gè)sleep語(yǔ)句(模擬復(fù)雜邏輯),數(shù)據(jù)量為1k,運(yùn)行結(jié)果如下:

1k
res:4338, cost time:10.054503679275513
test_mp   res:4338, cost time:0.35697126388549805
test_pandarallel   res:4338, cost time:0.43415403366088867
test_delayed   res:4338, cost time:2.294757843017578

5. 小結(jié)

(1)如果數(shù)據(jù)量比較少,并行處理比單次執(zhí)行效率更慢;

(2)如果apply的函數(shù)邏輯簡(jiǎn)單,并行處理比單次執(zhí)行效率更慢。

6. 問題及解決方法

(1)ImportError: This platform lacks a functioning sem_open implementation, therefore, the required synchronization primitives needed will not function, see issue 3770.

https://www.jianshu.com/p/0be1b4b27bde

(2)Linux查看物理CPU個(gè)數(shù)、核數(shù)、邏輯CPU個(gè)數(shù)

https://lover.blog.csdn.net/article/details/113951192

(3) 進(jìn)度條的使用

https://www.jb51.net/article/206219.htm

到此這篇關(guān)于詳解pandas apply 并行處理的幾種方法的文章就介紹到這了,更多相關(guān)pandas apply 并行處理內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • pandas中apply和transform方法的性能比較及區(qū)別介紹
  • 對(duì)pandas中apply函數(shù)的用法詳解
  • pandas 使用apply同時(shí)處理兩列數(shù)據(jù)的方法
  • pandas apply 函數(shù) 實(shí)現(xiàn)多進(jìn)程的示例講解
  • pandas使用apply多列生成一列數(shù)據(jù)的實(shí)例
  • pandas apply多線程實(shí)現(xiàn)代碼
  • pandas使用函數(shù)批量處理數(shù)據(jù)(map、apply、applymap)
  • pandas提升計(jì)算效率的一些方法匯總

標(biāo)簽:合肥 哈爾濱 大慶 烏蘭察布 烏蘭察布 平頂山 海南 郴州

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《詳解pandas apply 并行處理的幾種方法》,本文關(guān)鍵詞  詳解,pandas,apply,并行,處理,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《詳解pandas apply 并行處理的幾種方法》相關(guān)的同類信息!
  • 本頁(yè)收集關(guān)于詳解pandas apply 并行處理的幾種方法的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃
    欧美日产国产精品| 国产精品影音先锋| 日韩理论片中文av| 国产精品美女久久久久久久久| 欧美不卡123| 欧美电影在哪看比较好| 91精品欧美久久久久久动漫| 欧美卡1卡2卡| 精品欧美一区二区三区精品久久| 日韩精品一区二区在线观看| 精品国产在天天线2019| 欧美精品 国产精品| 日韩欧美高清一区| 欧美国产禁国产网站cc| 中文字幕乱码久久午夜不卡 | 韩国精品主播一区二区在线观看 | 久久人人爽人人爽| 欧美激情一区二区三区在线| 中文字幕亚洲一区二区av在线 | 亚洲欧洲精品成人久久奇米网| 亚洲欧美国产毛片在线| 亚洲一区二区成人在线观看| 日产国产高清一区二区三区 | 国产亚洲成av人在线观看导航| 欧美国产丝袜视频| 亚洲一区在线播放| 久久国产日韩欧美精品| 成人高清免费观看| 欧美日本一区二区| 久久嫩草精品久久久精品| 一区二区中文字幕在线| 日韩电影免费一区| 国产黄色91视频| 欧洲精品中文字幕| 精品国产3级a| 亚洲激情六月丁香| 久久国产精品99久久久久久老狼| 成人高清在线视频| 欧美一区二区三区免费大片| 中文字幕不卡在线| 男男gaygay亚洲| 国产成人av电影| 日韩一级大片在线观看| 中文字幕欧美一区| 国产伦精品一区二区三区视频青涩| 一本色道久久综合精品竹菊 | 99久久久精品免费观看国产蜜| 91精品视频网| 亚洲影院久久精品| 成人午夜免费电影| 欧美电影精品一区二区| 亚洲自拍偷拍av| av电影在线观看一区| 久久一区二区三区国产精品| 亚洲最新视频在线观看| 成人激情视频网站| 久久久精品人体av艺术| 免费黄网站欧美| 51午夜精品国产| 亚洲精品美腿丝袜| 99久久精品免费看国产免费软件| 久久女同精品一区二区| 久久精品国产99久久6| 欧美在线短视频| 亚洲日本va午夜在线电影| 国产成人亚洲精品狼色在线| 精品久久久久久久久久久久包黑料| 亚洲国产精品天堂| 欧美日韩一级大片网址| 亚洲一区在线视频| 欧美日韩精品电影| 日韩电影在线免费看| 欧美另类z0zxhd电影| 午夜精品成人在线视频| 欧美日韩电影在线播放| 午夜精品爽啪视频| 91精品国产综合久久精品| 丝袜美腿成人在线| 欧美一个色资源| 美女爽到高潮91| 日韩欧美电影在线| 国产精品一区专区| 欧美国产欧美亚州国产日韩mv天天看完整| 韩国欧美国产一区| 中文字幕电影一区| 色88888久久久久久影院按摩| 亚洲女性喷水在线观看一区| 日本精品一区二区三区高清| 一区二区欧美精品| 制服丝袜av成人在线看| 日本系列欧美系列| 久久嫩草精品久久久精品| 国产成人在线视频免费播放| 自拍偷拍亚洲激情| 9191国产精品| 国产高清久久久| 亚洲综合网站在线观看| 欧美一区二区三区四区五区| 极品美女销魂一区二区三区免费| 久久久久久97三级| 日本电影欧美片| 日韩电影在线一区二区三区| 国产女主播一区| 51精品秘密在线观看| 国产又黄又大久久| 亚洲欧美日韩小说| 欧美不卡视频一区| 色综合久久久网| 久久国产欧美日韩精品| 亚洲日本一区二区| 欧美mv日韩mv| 一本久久a久久免费精品不卡| 蜜臀精品久久久久久蜜臀| 国产精品国产精品国产专区不蜜 | 另类专区欧美蜜桃臀第一页| 日韩一区在线看| 日韩一级高清毛片| 91麻豆免费看| 国产福利一区在线观看| 亚洲成人激情社区| 国产精品欧美一区喷水| 91精品国产一区二区三区香蕉| 99精品视频一区二区| 久久精品国产久精国产爱| 亚洲日本电影在线| 中文天堂在线一区| 欧美一级日韩一级| 欧美羞羞免费网站| 99久久精品国产一区| 国产真实精品久久二三区| 午夜影视日本亚洲欧洲精品| 综合激情成人伊人| 久久综合五月天婷婷伊人| 欧美日韩一区二区三区四区五区 | 一区二区三区久久久| 国产欧美日韩视频在线观看| 日韩欧美综合一区| 91.麻豆视频| 欧美日韩你懂得| 色天使久久综合网天天| 91日韩精品一区| 不卡的av中国片| 福利视频网站一区二区三区| 久久91精品国产91久久小草| 天使萌一区二区三区免费观看| 亚洲精品日韩综合观看成人91| 国产精品美女久久久久久久网站| 国产亚洲综合在线| 国产色91在线| 久久综合九色综合欧美就去吻| 欧美一区二区三区人| 91精品国产色综合久久不卡电影| 欧美日韩在线播放一区| 欧美视频在线一区二区三区| 91色porny在线视频| 一本久道久久综合中文字幕 | 舔着乳尖日韩一区| 日韩av电影一区| 久久精品国产一区二区三| 蜜桃久久久久久久| 国产综合成人久久大片91| 国内精品自线一区二区三区视频| 国产在线精品一区二区| 国产aⅴ综合色| 99久久99久久精品国产片果冻 | 看片网站欧美日韩| 国产一区二区三区四区五区美女| 国产精品2024| 成年人午夜久久久| 色诱视频网站一区| 日韩午夜精品电影| 欧美韩日一区二区三区四区| 国产精品国产三级国产aⅴ入口 | 亚洲色图自拍偷拍美腿丝袜制服诱惑麻豆| 国产精品第一页第二页第三页| 亚洲激情在线激情| 精品在线观看视频| 99久久精品国产导航| 这里只有精品99re| 中文字幕不卡一区| 亚洲成人黄色小说| 国产一区二区网址| 91香蕉视频在线| 欧美va亚洲va国产综合| 国产精品毛片久久久久久久| 一区二区三区在线观看国产| 欧美aaaaaa午夜精品| 成人高清视频在线| 日韩三级在线观看| 最新日韩av在线| 免费成人av资源网| 97久久精品人人做人人爽 | 黄色日韩网站视频| av电影在线观看完整版一区二区| 5566中文字幕一区二区电影| 亚洲国产精品99久久久久久久久| 亚洲高清久久久| 成人国产精品免费观看视频| 制服丝袜亚洲色图| 国产精品每日更新在线播放网址|