Recent Post»

Recent Comment»

Archive»

« 2025/1 »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31

iconv를 이용한 중국어 코드 변환

리눅스 | 2010. 12. 8. 11:07 | Posted by 블로장생

중국어로 된 텍스트 파일을 열었을 때 글자가 깨진다면 코드가 맞지 않아서 그렇다.

UTF-8로 변환하기

다음과 같이 하면 GB2312 코드가 UTF-8로 변환이 된다.

iconv –f GB2312 –t UTF-8 <input file> > <output file>

GB2312가 아닌 경우라면 iconv –list로 지원하는 인코딩 형식을 확인한 다음 GB2312 대신에 다른 형식을 인자로 주면 된다. 모르면 이것 저것 해 보면 된다.

간체를 번체로 변경하기

우리가 사용하는 한자는 번체이기 때문에 간체를 번체로 변경하고 싶은 경우가 있다. 다음과 같이 하면 된다.

iconv –f GB2312 –t Big5 <input file> | iconv –f Big5 –t UTF-8 > <output file>

간체인 GB2312를 번체인 BIG5로 한 번 변환하고 다시 UTF-8로 변환하는 예이다.

: