devmoa

Mecab과 Nori, Fastcat 플러그인 색인 성능 비교

다나와·2023년 1월 5일·00
Mecab-koNoriFastcatElasticsearch한국어 분석기색인 성능

AI 요약

Beta

다나와 기술 블로그는 기존에 사용하던 Fastcat 기반의 상품명 분석기를 대체할 신규 한국어 분석기 탐색 과정을 공유합니다. Mecab-ko와 Nori 두 가지 분석기를 대상으로 엘라스틱서치 환경에서 색인 성능을 벤치마킹했습니다.

300만, 700만 건의 문서로 인덱스를 생성한 결과, Mecab-ko와 Fastcat의 성능이 동일했으며 Nori는 상대적으로 낮은 성능을 보였습니다. 엘라스틱서치 공식 지원 플러그인임에도 Nori의 성능이 기대에 미치지 못했으며, 현재 다나와 시스템에는 적합하지 않다는 결론을 내립니다.

다만, 사전의 영향력도 고려해야 할 요소로 언급됩니다.

이 글이 궁금하신가요?

원문 블로그에서 전체 내용을 확인해 보세요

원문 읽으러 가기

AI 추천 연관 게시글

이 글과 관련된 다른 기술 블로그 글을 AI가 추천합니다