Linux下将UTF8编码批量转换成GB2312编码的方法linux utf8转gb2312

首页
Linux下将UTF8编码批量转换成GB2312编码的方法linux utf8转gb2312

Linux下将UTF8编码批量转换成GB2312编码的方法linux utf8转gb2312

2022-07-20 20:29:05 网络知识 官方管理员

111|0条评论

　　UTF8编码和GB2312编码是有区别的，在sqlplus中导入UTF8编码的sql脚本就会出现乱码错误，这时就需要将UTF8编码转换成GB2312编码，可是一个个的转换十分麻烦，下面小编就教你如何在Linux下将UTF8编码批量转换成GB2312编码。

　　背景

　　本人在使用oracle的sqlplus批量导入UTF8编码的sql脚本时，由于不了解如何设置让sqlplus识别UTF8格式，导致出现乱码、错行等错误，而使工作无法继续，在google无果的情况下只好想办法转换编码。

　　由于文件较多，手动转换太麻烦，于是想到用脚本批量转换，幸好网上相关脚本比较多，实现起来唯一的麻烦是UTF8的BOM标记。

　　内容：

　　代码如下：

　　#！/bin/bash

　　forloopin`find。-typef-name*.sql-print`do

　　echo$loop

　　mv-f$loop$loop.tmp

　　dos2unix$loop.tmp

　　file_check_utf8=‘file_check_utf8.log’

　　sed-n‘1l’$loop.tmp》$file_check_utf810.ifgrep‘^\\357\\273\\277’$file_check_utf8》/dev/null2》&111.then

　　echo‘UTF-8BOM’

　　sed-n-e‘1s/^.。。//’-e‘wintermediate.txt’$loop.tmp14.iconv-fUTF-8-tGB2312-o$loopintermediate.txt15.rm-rfintermediate.txt

　　rm-rf$loop.tmp

　　elificonv-fUTF-8-tGB2312$loop.tmp》/dev/null2》&118.then

　　echo‘UTF-8’

　　iconv-fUTF-8-tGB2312-o$loop$loop.tmp21.rm-rf$loop.tmp

　　else

　　echo‘ANSI’

　　mv-f$loop.tmp$loop

　　rm-rf$file_check_utf8

　　#模拟unix2dos，要求文本文件最后一行必须有换行符28.sed-n-e‘s/$/\r/g’-e‘w’$loop.tmp$loop29.mv-f$loop.tmp$loop

　　done

　　#！/bin/bash

　　forloopin`find。-typef-name*.sql-print`do

　　echo$loop

　　mv-f$loop$loop.tmp

　　dos2unix$loop.tmp

　　file_check_utf8=‘file_check_utf8.log’

　　sed-n‘1l’$loop.tmp》$file_check_utf810.ifgrep‘^\\357\\273\\277’$file_check_utf8》/dev/null2》&111.then

　　echo‘UTF-8BOM’

　　sed-n-e‘1s/^.。。//’-e‘wintermediate.txt’$loop.tmp14.iconv-fUTF-8-tGB2312-o$loopintermediate.txt15.rm-rfintermediate.txt

　　rm-rf$loop.tmp

　　elificonv-fUTF-8-tGB2312$loop.tmp》/dev/null2》&118.then

　　echo‘UTF-8’

　　iconv-fUTF-8-tGB2312-o$loop$loop.tmp21.rm-rf$loop.tmp

　　else

　　echo‘ANSI’

　　mv-f$loop.tmp$loop

　　rm-rf$file_check_utf8

　　#模拟unix2dos，要求文本文件最后一行必须有换行符28.sed-n-e‘s/$/\r/g’-e‘w’$loop.tmp$loop29.mv-f$loop.tmp$loop

　　done

　　解释

　　1.处理UTF8的BOM，本人没有找到好的办法，最后用sed＋grep判断了一下，如果前三个字节是\\357\\273\\277，则文件必定是UTF8，用sed去掉这三个字节再转换

　　2.为了避免重复或者遗漏，脚本中用iconv对没有BOM的文件尝试转换了一把，转换成功说明文件是UTF8，否则说明是ANSI也就是GB2312

　　3.关于最后的sed命令，那是因为本人的系统上没有unix2dos命令，所以进行了模拟，目的是为了方便自己在windows下查看和编辑

　　以上就是Linux下将UTF8编码批量转换成GB2312编码的方法介绍了，转换后就能解决乱码等问题，可使用命令镜像批量转换，你学会了吗？

如何在Linux下设置访问控制列表(ACL来控制用户的权限linux acl权限设置 Linux中使用whereis命令快速查找文件只限程序名linux whereis命令详解

发表评论：取消回复

MORE>

热门推荐网友点评

访客评论文章：

电脑上软件双击打不开win10电脑点不开软件最简单办法win10电脑双击软件打不开是为什么

你好，显示拒绝访问，怎么办，谢谢...
交指评论文章：

快速全选的快捷键是什么,选择全部快捷键全选是哪个

求田问舍，怕应羞见，刘郎才气。...
聪图评论文章：

快速全选的快捷键是什么,选择全部快捷键全选是哪个

一视同仁虎头虎脑...
爬被评论文章：

快速全选的快捷键是什么,选择全部快捷键全选是哪个

窗含西岭千秋雪，门泊东吴万里船。...
古呵评论文章：

快速全选的快捷键是什么,选择全部快捷键全选是哪个

画龙点睛一举两得...

最近发表

网站分类

网络知识

Linux下将UTF8编码批量转换成GB2312编码的方法linux utf8转gb2312

Linux下将UTF8编码批量转换成GB2312编码的方法linux utf8转gb2312

韩博士系统重装u盘,韩博士系统重装u盘如何使用

Mac苹果电脑安装windows系统,苹果笔记本安装双系统

mac如何清理u盘,mac怎么清空u盘后恢复文件

打印机已连接但无法打印打印机连接正常打印没反应的解决方法打印机已连接但是无法打印什么原因

小米手机无法启动小米手机开不了机怎么办教你一招解决小米手机开不开机怎么回事求帮助

海信电视不识别u盘apk电视无法识别u盘apk文件终极方法海信电视不识别u盘里的apk文件

地铁工作人员工资是多少

电脑一直正在启动windows怎么办电脑开机停留在启动界面怎么办电脑启动时一直停留在"正在启动windows"界面