校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃

主頁 > 知識庫 > linux中去掉文件重復數據行的方法(去重復ip)

linux中去掉文件重復數據行的方法(去重復ip)

熱門標簽:無錫ai智能語音電銷機器人廠家 濟南智能語音電銷機器人加盟 易聯系統外呼營銷來回呼 電銷機器人怎么打卡 如何找電銷機器人 江西意向度高的羿智云外呼系統 河南語音電銷機器人加盟公司 無錫真人電銷機器人供應商 抖音商家地圖標注入駐店

一、去掉相鄰重復的數據行


復制代碼
代碼如下:

$cat data1.txt | uniq
輸出:
beijing
wuhan
beijing
wuhan

二、去掉所有重復的數據行


復制代碼
代碼如下:

$cat data1.txt | sort | uniq

注:
只有uniq命令的話,只是把相鄰的重復的數據行去掉。
如果先 sort 的話,就會把所有重復的數據行變成相鄰的數據行,再 uniq 的話,就去掉所有重復的數據行了。

輸出:
beijing 
wuhan

附:data1.txt


復制代碼
代碼如下:

[root@syy ~]# cat data1.txt
beijing
beijing
wuhan
wuhan
wuhan
beijing
beijing
beijing
wuhan
wuhan

注:在過濾日志中的IP地址很有用。

Linux下刪除大數據文件中部分字段重復的行

最近寫的一個數據采集程序生成了一個含有1千多萬行數據的文件,數據由4個字段組成,按照要求需要刪除第二個字段重復的行,找來找去linux下也沒找到合適的工具,sed/gawk等流處理工具只能針對一行一行處理,并無法找到字段重復的行??磥碇缓米约簆ython一個程序了,突然想起來利用mysql,于是進行乾坤大挪移:

1. 利用mysqlimport --local dbname data.txt導入數據到表中,表名要與文件名一致
2. 執行下列sql語句(要求唯一的字段為uniqfield)


復制代碼
代碼如下:

use dbname;
alter table tablename add rowid int auto_increment not null;
create table t select min(rowid) as rowid from tablename group by uniqfield;
create table t2 select tablename .* from tablename,t where tablename.rowid= t.rowid;/p> p>drop table tablename;
rename table t2 to tablename;

標簽:河源 常德 江蘇 綏化 保山 亳州 濱州 宿州

巨人網絡通訊聲明:本文標題《linux中去掉文件重復數據行的方法(去重復ip)》,本文關鍵詞  linux,中,去掉,文件,重復,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《linux中去掉文件重復數據行的方法(去重復ip)》相關的同類信息!
  • 本頁收集關于linux中去掉文件重復數據行的方法(去重復ip)的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 南华县| 独山县| 潜江市| 彭州市| 陆川县| 晋中市| 涪陵区| 松阳县| 土默特左旗| 新干县| 玉环县| 阳江市| 泰兴市| 凤阳县| 保康县| 紫云| 枣阳市| 上栗县| 大庆市| 高尔夫| 嘉禾县| 鄂尔多斯市| 和龙市| 名山县| 华宁县| 南靖县| 呼伦贝尔市| 建始县| 河间市| 罗山县| 屯昌县| 巫溪县| 双柏县| 富顺县| 长武县| 盈江县| 彩票| 苗栗县| 工布江达县| 阳春市| 河池市|