중국어로 된 텍스트 파일을 열었을 때 글자가 깨진다면 코드가 맞지 않아서 그렇다.
UTF-8로 변환하기
다음과 같이 하면 GB2312 코드가 UTF-8로 변환이 된다.
iconv –f GB2312 –t UTF-8 <input file> > <output file>
GB2312가 아닌 경우라면 iconv –list로 지원하는 인코딩 형식을 확인한 다음 GB2312 대신에 다른 형식을 인자로 주면 된다. 모르면 이것 저것 해 보면 된다.
간체를 번체로 변경하기
우리가 사용하는 한자는 번체이기 때문에 간체를 번체로 변경하고 싶은 경우가 있다. 다음과 같이 하면 된다.
iconv –f GB2312 –t Big5 <input file> | iconv –f Big5 –t UTF-8 > <output file>
간체인 GB2312를 번체인 BIG5로 한 번 변환하고 다시 UTF-8로 변환하는 예이다.