mecab-ko ์๊ฐ
mecab-ko๋ ์์ ํ๋ข ํ๋ก์ ํธ์์ ์ฌ์ฉํ๊ธฐ ์ํ MeCab์ fork ํ๋ก์ ํธ ์ ๋๋ค.
์ต์ํ์ ๋ณ๊ฒฝ์ผ๋ก ํ๊ตญ์ด์ ํน์ฑ์ ๋ง๋ ๊ธฐ๋ฅ์ ์ถ๊ฐํ๋ ๊ฒ์ด ๋ชฉํ์ ๋๋ค.
mecab-ko์์ ์ถ๊ฐ๋ ๊ธฐ๋ฅ.
๊ณต๋ฐฑ ๋ฌธ์(white space)๋ฅผ ํฌํจํ๋ ํน์ ํ์ฌ ๋น์ฉ ๋๋ฆผ
๋์ด์ฐ๊ธฐ๋ฅผ ํ์ง ์๋ ์ผ๋ณธ์ด์ ๋ฌ๋ฆฌ ๋์ด์ฐ๊ธฐ๋ฅผ ํ๋ ํ๊ตญ์ด ํน์ฑ์ ๋ง๊ฒ ํน์ ํ์ฌ๊ฐ ๋์ด์ฐ๊ธฐ ๋์ด์๋ ๊ฒฝ์ฐ ํด๋น ํ์ฌ์ ๋น์ฉ์ ๋๋ฆฌ๋ ๊ธฐ๋ฅ (์ฌ์ ์ค์ (dicrc)์ ์ค์ ๊ฐ์ ์ง์ )
mecab์ ์ฌ์ฉํ์ฌ ๋ถ์
:::text
ํํ ์ด์ธ์ ๊ฒ
ํํ NN,T,ํํ,*,*,*,*
์ด JKS,F,์ด,*,*,*,*
์ธ NN,F,์ธ,*,*,*,*
์ JKG,F,์,*,*,*,*
๊ฒ NNB,T,๊ฒ,*,*,*,*
EOS
mecab-ko๋ฅผ ์ฌ์ฉํ์ฌ ๋ถ์
:::text
ํํ ์ด์ธ์ ๊ฒ
ํํ NN,T,ํํ,*,*,*,*
์ด์ธ NN,F,์ด์ธ,*,*,*,*
์ JKG,F,์,*,*,*,*
๊ฒ NNB,T,๊ฒ,*,*,*,*
EOS
์ค์ ๋ฐฉ๋ฒ
MeCab์ ์ฌ์ ์ค์ (dicrc)์์ ๋ค์๊ณผ ๊ฐ์ด ์ค์ ํฉ๋๋ค.
:::text
# ์ข์ธก์ ๊ณต๋ฐฑ์ ํฌํจํ๋ ํ์ฌ์ ์ฐ์ ๋น์ฉ์ ๋๋ฆฌ๊ธฐ ์ํ ์ค์ ์
๋๋ค.
# mecab-ko์์๋ง ์ฌ์ฉ๋๋ ์ค์ ์
๋๋ค. ๋ค์๊ณผ ๊ฐ์ ํ์์ ๊ฐ์ง๋๋ค.
# <posid 1>,<posid 1 penalty cost>,<posid 2>,<posid 2 penalty cost> ...
#
# ์) 120,6000 => posid๊ฐ 120์ธ ํ์ฌ(์กฐ์ฌ)์ ์ข์ธก์ ๊ณต๋ฐฑ์ ํฌํจํ ๊ฒฝ์ฐ
# ์ฐ์ ๋น์ฉ์ 6000๋งํผ ๋๋ฆผ
left-space-penalty-factor = 120,6000,184,6000,100,500
mecab-ko์ ์ค์น์ ์ฌ์ฉ๋ฒ
mecab-ko ์ค์น
mecab-ko ๋ค์ด๋ก๋ ํ์ด์ง์์ ์ต์ ๋ฒ์ ์ ์์ค๋ฅผ ๋ค์ด ๋ฐ๊ณ ์ค์นํฉ๋๋ค. tar.gz ์์ถ์ ํด์ ํ๊ณ ์ผ๋ฐ์ ์ธ ์์ ์ํํธ์จ์ด์ ๊ฐ์ ์์๋ก ์ค์นํ ์ ์์ต๋๋ค.
:::text
$ tar zxfv mecab-ko-XX.tar.gz
$ cd mecab-ko-XX
$ ./configure
$ make
$ make check
$ su
# make install
์ค์น ๋ฐฉ๋ฒ์ MeCab์ ๋์ผํ๋ฏ๋ก, ์์ธํ ๋ด์ฉ์ MeCab ํํ์ด์ง๋ฅผ ์ฐธ์กฐํ์๊ธฐ ๋ฐ๋๋๋ค.
์ฐธ๊ณ
- ์ค๋๋ ๋ฒ์ ์ ๋ฆฌ๋ ์ค ํ๊ฒฝ์์ ์ปดํ์ผ์ด ์๋๋ ๊ฒฝ์ฐ, ๋ค์์ ๊ธ์ ์ฐธ์กฐํ์๊ธฐ ๋ฐ๋๋๋ค. Cent OS 5.9์์ MeCab ๋ฐ mecab-ko-dic ์ค์นํ๊ธฐ
ํ๊ตญ์ด ์ฌ์ (mecab-ko-dic)์ ์ค์น์ ์ฌ์ฉ
mecab-ko-dic์ ์ค๋ช ์ ์ฐธ์กฐํ์๊ธฐ ๋ฐ๋๋๋ค.
๋ผ์ด์ผ์ค
mecab-ko์ ๋ผ์ด์ผ์ค๋ MeCab์ ๋ผ์ด์ผ์ค๋ฅผ ๊ทธ๋๋ก ๋ฐ๋ฆ ๋๋ค.
MeCab ๋ ๋ฌด๋ฃ ์ํํธ์จ์ด์ ๋๋ค. GPL (the GNU General Public License), LGPL (Lesser GNU General Public License) ๋๋ BSD ๋ผ์ด์ ์ค์ ๋ฐ๋ผ ์ํํธ์จ์ด๋ฅผ ์ฌ์ฉ, ์ฌ๋ฐฐํฌํ ์ ์์ต๋๋ค. ์์ธํ ๋ด์ฉ์ COPYING, GPL, LGPL, BSD ๊ฐ ํ์ผ์ ์ฐธ์กฐํ์ญ์์ค.