windows 에서 unicode 사용시 알아야 할 것들 프로그래밍

윈도우에서 캐릭터인코딩 문제때문에 삽질을 좀 했습니다. 
워낙 코드체계에 대한 기본 지식이 부족해서 검색을 해도 뭐가뭔지 모르겠더군요. >.<

http://www.novonetworks.com/ 의 Technical 게시판에 Unicode의 이해 라는 문서가 있는데 저 같은 초보에게 정말 도움이 많이 되었습니다. 글쓰신 분의 내공이 느껴지더라는...
이것 저것 자료들을 찾아보고 읽어보니 전체적인 내용이 정리가 좀 되네요. 
이해하고 나서 다시 보니 이전에 대충 알고있던 내용이 맞긴 맞는거였네요.. ㅠㅠ

Windows 환경에서 문자열은...
 * multi-byte character set 사용 시 ( char )
     - 문자를 1바이트 또는 2바이트를 이용한다. 
     - 한글 윈도우의 경우 cp949 코드페이지를 사용한다. (KS C 5601)
 * unicode character set ( wchar_t )
     - 문자를 표현하는데 2바이트를 사용한다.
     - UTF-16 little endian 인코딩을 사용한다.

아래는 테스트 코드 + 결과 화면입니다. 


덧글

  • 6l4ck3y3 2012/08/09 19:52 # 삭제 답글

    최근 서버에 로그를 남기는 작업을 하다가 한국과 중화권에 공통으로 들어가는 코드에
    char 로 로그를 남겨도 문제없이 한자가 찍혀서 혼란스러웠는데...
    Windows 에서 char 이 코드페이지에 따라 변경되는 멀티바이트여서 그랬나보네요
    제가 제대로 이해한 게 맞나요?
  • somma 2012/08/09 21:50 #

    정확히 ~ 맞습니다 ^^;
  • hil 2013/02/27 17:27 # 삭제 답글

    이 특정 정보를 정보 | 찾는을 추구하는 | 아주 긴 시간. 와 행운을 빌어 요 | 감사합니다 당신에게 감사합니다.
  • Kyung 2013/03/07 14:47 # 삭제 답글

    그럼에도 불구 게시물은 도 간단한 처음으로 에 대한. 있을까요 님이 하시기 바랍니다 확장 에게 비트 시간에서?게시물에 대한 | 감사합니다 당신에게 감사합니다.
  • 2014/10/16 14:43 # 삭제 답글

    보통 내가 블로그에 글을 읽지 않는다, 그러나 나는이 쓰기까지 매우 확인하고 이렇게 저를 강제로 말을하고 싶습니다! 당신의 쓰기의 맛이 저를 깜짝 놀라게하고있다. 감사합니다, 아주 좋은 게시 할 수 있습니다.
  • 2014/11/16 17:42 # 삭제 답글

    좋은 쓰기까지, 나는 자신의 블로그를 정기적으로 방문자 오전, 우수한 운영까지 유지하고, 그것은 긴 시간 동안 정기적 인 방문자가 될 것입니다.
댓글 입력 영역