Linux下删除大数据文件中部分字段重复行的方法linux 删除文件重复行

首页
Linux下删除大数据文件中部分字段重复行的方法linux 删除文件重复行

Linux下删除大数据文件中部分字段重复行的方法linux 删除文件重复行

2022-07-20 20:30:02 网络知识 官方管理员

174|0条评论

最近写的一个数据采集程序生成了一个含有1千多万行数据的文件，数据由4个字段组成，按照要求需要删除第二个字段重复的行，找来找去linux下也没找到合适的工具，sed/gawk等流处理工具只能针对一行一行处理，并无法找到字段重复的行。看来只好自己python一个程序了，突然想起来利用mysql，于是进行乾坤大挪移：

1.利用mysqlimport--localdbnamedata.txt导入数据到表中，表名要与文件名一致
2.执行下列sql语句(要求唯一的字段为uniqfield）

复制代码

linux配置防火墙iptables实例分享利用linux自带的iptables配置防火墙 linux中去掉文件重复数据行的方法(去重复iplinux去除文件重复行

发表评论：取消回复

MORE>

热门推荐网友点评

访客评论文章：

电脑上软件双击打不开win10电脑点不开软件最简单办法win10电脑双击软件打不开是为什么

你好，显示拒绝访问，怎么办，谢谢...
交指评论文章：

快速全选的快捷键是什么,选择全部快捷键全选是哪个

求田问舍，怕应羞见，刘郎才气。...
聪图评论文章：

快速全选的快捷键是什么,选择全部快捷键全选是哪个

一视同仁虎头虎脑...
爬被评论文章：

快速全选的快捷键是什么,选择全部快捷键全选是哪个

窗含西岭千秋雪，门泊东吴万里船。...
古呵评论文章：

快速全选的快捷键是什么,选择全部快捷键全选是哪个

画龙点睛一举两得...

最近发表

网站分类

网络知识