Search Engine 5

[Search Engine] 영한 자동변환 사용...

예전에... 한글로 변환이 안된 생타에서 영어를 입력했을 때 바로 한글로 변환하는 것을 dll로 만들어서 올렸었습니다... 그런데 어떤 분께서 사용하는 방법을 알려달라고 하시기에... 화면은 MFC로 했지만... 간단하게 console로 출력해 보겠습니다. 압축 파일을 받고나서 압축을 풀고 나면... 이렇게 3개의 파일이 있게 됩니다... 각 3개의 파일 용도는 아실거라 보고 진행합니다... 음... 기본 프로젝트를 생성하고... 헤더파일과 lib파일을 새로 만든 프로젝트와 같은 디렉토리 안에 복사를 합니다. 이렇게 하고... 코드는 #include using namespace std; #include "AutoConvert.h" int main(int argc, char** argv) { char*sz..

Search Engine 2009.09.16

[Search Engine] 영어에서 한글로 자동 변환...

검색엔진에 대해서 공부하다 보니... 영어에서 한글로 자동변환 해주는 것을 만들게 되었습니다... 네이버나 다음.. 영어로 글자를 치는데 자동으로 한글로 변환이 되서 검색 결과가 나오게 되죠 다른곳에서는 어떻게 될지 모르겠지만... 제 생각에는 "duddjfh clsmswnd" -> "영어로 치는중" 으로 바로 변환이 되어서 검색이 들어간다고 생각되는군요.. 머 솔직히 검색엔진에 대해서 공부를 많이 한 것도 아니라서... ㅜㅜ 이렇게 될려면 자동으로 변환해 주는 것을 만들어야 겠다는 생각이 되서... 이런식으로... C++의 Dll로 만들게 되었습니다... 머.. 영어 이외에 특수 문자가 입력 되면... 변환이 안되긴 하자만... ㅎㅎ Dll과 header파일은 첨부합니다...

Search Engine 2009.06.28

[search engine] 한글 초중종성 분리...

검색 엔진을 만들게 되면서... 한글 처리에 상당한 신경을 쓰게 되었습니다... 보통 검색 사이트에서 해주는 자동완성 검색들... 이 부분들은 대부분 한글들은 초중종성으로 분해되어 indexing이 되는 겁니다... 그럼 한글의 초중종성은 어떻게 분해를 하느냐... 한글은 기본적으로 2바이트의 multibyte를 쓰게 되죠... 영어는 1byte만 있어도 되지만... 이 부분을 처리하기 위해서는 single byte, multi-byte, unicode, utf-8에 대해서도 좀 알아야 할듯 싶기도 합니다... 서두가 좀 길긴 했습니다... 본론으로 들어가면... 한글을 자소 단위로 분리하기 위해서는 unicode로 된 한글이 필요하고... 그리고 분리하는 공식이 존재하게 되는겁니다. •nChar = U..

Search Engine 2009.05.24

Sphinx 에서 한글검색 하기...

sphinx search engine을 사용해보면서... 어쨌든... 나는 한국인이니 한글 검색을 해야 겠다는 사명으로 ㅋㅋㅋ 한글 검색이 가능하도록 해보았다... 음... 지금까지 해본 방법으로 두가지 방법이 생겼음... 1. DBMS = UTF8, sphinx.conf 설정 utf8... - DBMS 설정을 UTF8으로 해둔다... euckr 방법으로도 할 수 있지만... euckr방법으로는 표현할 수 있는 한글의 갯수라든지, 초/중/종성으로 나누는 방법이 없다! ㅜㅜ// - DMBS는 mysql을 사용하였고, MySQL 설정파일에서 모든 character_set 설정을 utf8으로 해두어야 함. - DBMS설정이 UTF8으로 되어 있고, sphinx.conf 설정 파일에서도 charset_type을..

Search Engine 2008.05.01