mecab-ko-msvc
μμ¬μ μΈ μ΄μ λ‘ mecab-ko-msvcμ΄λ¦μ μ¬μ©νμ§λ§, Windowsμ ν¨κ» macOSμ Linuxλ μ§μν©λλ€.
μ€μΉ
Windows
- μ€ν μ»΄ν¨ν°μ λ§λ μ΅μ λ²μ μ λ€μ΄λ‘λ λ°μ΅λλ€. x86, x64 λ²μ μ μ 곡ν©λλ€.
-
-r
μ΅μ κ³Ό-d
μ΅μ μ μ¬μ©ν κ²½μ°λ λ¬Έμ κ° μμ§λ§ μ΅μ μ νκ²½μ μν΄C:\mecab
ν΄λμ μμΆμ ν΄μ ν©λλ€. - μ¬μ μ μ€μΉν©λλ€. mecab-ko-dic.zipμ λ€μ΄λ‘λνμ¬
C:\mecab\share\mecab-ko-dic
ν΄λμ μμΆμ ν΄μ ν©λλ€. - νκ²½λ³μ
PATH
μC:\mecab\bin
μ μΆκ°νκ±°λ,C:\mecab\bin\mecab.exe
λ₯Ό μ€νν©λλ€.
macOS / Linux
- μ€ν μ»΄ν¨ν°μ λ§λ μ΅μ λ²μ μ λ€μ΄λ‘λ λ°μ΅λλ€. macOS (x86_64, arm64), Linux (x86_64, aarch64) λ²μ μ μ 곡ν©λλ€.
-
-r
μ΅μ κ³Ό-d
μ΅μ μ μ¬μ©ν κ²½μ°λ λ¬Έμ κ° μμ§λ§ μ΅μ μ νκ²½μ μν΄/opt/mecab
ν΄λμ μμΆμ ν΄μ ν©λλ€.- λͺ
λ Ήμ΄:
sudo tar -C /opt -xvzf mecab-ko-<λ²μ >.tar.gz
- λͺ
λ Ήμ΄:
- μ¬μ μ μ€μΉν©λλ€. mecab-ko-dic.tar.gzpμ λ€μ΄λ‘λνμ¬
/opt/mecab/share/mecab-ko-dic
ν΄λμ μμΆμ ν΄μ ν©λλ€.- λͺ
λ Ήμ΄:
sudo tar -C /opt/mecab/share -xvzf mecab-ko-dic.tar.gz
- λͺ
λ Ήμ΄:
- νκ²½λ³μ
PATH
μ/opt/mecab/bin
μ μΆκ°νκ±°λ,/opt/mecab/bin/mecab
λ₯Ό μ€νν©λλ€.
Python
- pipλ₯Ό μ΄μ©νμ¬ Python λ²μ μ μ€μΉν μ μμ΅λλ€.
- λͺ
λ Ήμ΄:
pip3 install mecab-ko-msvc mecab-ko-dic-msvc
- λͺ
λ Ήμ΄:
- λ€μκ³Ό κ°μ΄ Python ν¨ν€μ§μ λ΄μ₯λ μ¬μ μ μ¬μ©ν μ μμ΅λλ€.
$ python3
Python 3.11.3 (main, Jun 5 2023, 09:32:32) [GCC 13.1.1 20230429] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import MeCab
>>> tagger = MeCab.Tagger()
>>> tagger.parse("무κΆνκ½μ΄νΌμμ΅λλ€.")
'무κΆν\tNNG,*,F,무κΆν,Compound,*,*,무κΆ/NNG/*+ν/NNG/*\nκ½\tNNG,*,T,κ½,*,*,*,*\nμ΄\tJKS,*,F,μ΄,*,*,*,*\nνΌ\tVV,*,F,νΌ,*,*,*,*\nμ\tEP,*,T,μ,*,*,*,*\nμ΅λλ€\tEF,*,F,μ΅λλ€,*,*,*,*\n.\tSF,*,*,*,*,*,*,*\nEOS\n'
μ¬μ© μ 보
- νμ¬ λ²μ μμλ Windows cmdμμ μΆλ ₯μ΄ μ λλ‘ λμ§ μμ΅λλ€.
mecab.exe -o output.txt input.txt
λͺ λ ΉμΌλ‘ νμΌλ‘ μΆλ ₯νκ±°λ mecab-python-msvc λ₯Ό μ΄μ©ν΄μ Pythonμμ μ¬μ©ν΄μΌ ν©λλ€.input.txt
νμΌμ λ©λͺ¨μ₯μμ μ μ₯ν κ²½μ° μΈμ½λ©μ UTF-8μΌλ‘ μ§μ ν΄μΌ ν©λλ€. - λ©λͺ¨μ₯μ μ΄μ©νμ¬ μ μ₯νκ³ μ¬μ©ν κ²½μ° μΆλ ₯μ μ λΆλΆμ νμμλ
SY,*,*,*,*,*,*,*
κ° λνλκ² λ©λλ€. μ΄λ λ©λͺ¨μ₯μ΄ νμΌμ μ μ₯ν κ²½μ° BOMμ μΆκ°νκΈ° λλ¬Έμ λλ€. λ€λ₯Έ μλν°λ₯Ό μ¬μ©νμ¬ BOM μμ΄ μ μ₯μ νλ€λ©΄ λ¬Έμ κ° μκΈ°μ§ μμ΅λλ€.
mecab-ko μκ°
mecab-koλ μμ νλ’ νλ‘μ νΈμμ μ¬μ©νκΈ° μν MeCabμ fork νλ‘μ νΈ μ λλ€.
μ΅μνμ λ³κ²½μΌλ‘ νκ΅μ΄μ νΉμ±μ λ§λ κΈ°λ₯μ μΆκ°νλ κ²μ΄ λͺ©νμ λλ€.
mecab-koμμ μΆκ°λ κΈ°λ₯.
곡백 λ¬Έμ(white space)λ₯Ό ν¬ν¨νλ νΉμ νμ¬ λΉμ© λλ¦Ό
λμ΄μ°κΈ°λ₯Ό νμ§ μλ μΌλ³Έμ΄μ λ¬λ¦¬ λμ΄μ°κΈ°λ₯Ό νλ νκ΅μ΄ νΉμ±μ λ§κ² νΉμ νμ¬κ° λμ΄μ°κΈ° λμ΄μλ κ²½μ° ν΄λΉ νμ¬μ λΉμ©μ λ리λ κΈ°λ₯ (μ¬μ μ€μ (dicrc)μ μ€μ κ°μ μ§μ )
mecabμ μ¬μ©νμ¬ λΆμ
:::text
νν μ΄μΈμ κ²
νν NN,T,νν,*,*,*,*
μ΄ JKS,F,μ΄,*,*,*,*
μΈ NN,F,μΈ,*,*,*,*
μ JKG,F,μ,*,*,*,*
κ² NNB,T,κ²,*,*,*,*
EOS
mecab-koλ₯Ό μ¬μ©νμ¬ λΆμ
:::text
νν μ΄μΈμ κ²
νν NN,T,νν,*,*,*,*
μ΄μΈ NN,F,μ΄μΈ,*,*,*,*
μ JKG,F,μ,*,*,*,*
κ² NNB,T,κ²,*,*,*,*
EOS
μ€μ λ°©λ²
MeCabμ μ¬μ μ€μ (dicrc)μμ λ€μκ³Ό κ°μ΄ μ€μ ν©λλ€.
:::text
# μ’μΈ‘μ 곡백μ ν¬ν¨νλ νμ¬μ μ°μ λΉμ©μ λ리기 μν μ€μ μ
λλ€.
# mecab-koμμλ§ μ¬μ©λλ μ€μ μ
λλ€. λ€μκ³Ό κ°μ νμμ κ°μ§λλ€.
# <posid 1>,<posid 1 penalty cost>,<posid 2>,<posid 2 penalty cost> ...
#
# μ) 120,6000 => posidκ° 120μΈ νμ¬(μ‘°μ¬)μ μ’μΈ‘μ 곡백μ ν¬ν¨ν κ²½μ°
# μ°μ λΉμ©μ 6000λ§νΌ λλ¦Ό
left-space-penalty-factor = 120,6000,184,6000,100,500
mecab-koμ μ€μΉμ μ¬μ©λ²
mecab-ko μ€μΉ
mecab-ko λ€μ΄λ‘λ νμ΄μ§μμ μ΅μ λ²μ μ μμ€λ₯Ό λ€μ΄ λ°κ³ μ€μΉν©λλ€. tar.gz μμΆμ ν΄μ νκ³ μΌλ°μ μΈ μμ μννΈμ¨μ΄μ κ°μ μμλ‘ μ€μΉν μ μμ΅λλ€.
:::text
$ tar zxfv mecab-ko-XX.tar.gz
$ cd mecab-ko-XX
$ ./configure
$ make
$ make check
$ su
# make install
μ€μΉ λ°©λ²μ MeCabμ λμΌνλ―λ‘, μμΈν λ΄μ©μ MeCab ννμ΄μ§λ₯Ό μ°Έμ‘°νμκΈ° λ°λλλ€.
μ°Έκ³
- μ€λλ λ²μ μ 리λ μ€ νκ²½μμ μ»΄νμΌμ΄ μλλ κ²½μ°, λ€μμ κΈμ μ°Έμ‘°νμκΈ° λ°λλλ€. Cent OS 5.9μμ MeCab λ° mecab-ko-dic μ€μΉνκΈ°
νκ΅μ΄ μ¬μ (mecab-ko-dic)μ μ€μΉμ μ¬μ©
mecab-ko-dicμ μ€λͺ μ μ°Έμ‘°νμκΈ° λ°λλλ€.
λΌμ΄μΌμ€
mecab-koμ λΌμ΄μΌμ€λ MeCabμ λΌμ΄μΌμ€λ₯Ό κ·Έλλ‘ λ°λ¦ λλ€.
MeCab λ λ¬΄λ£ μννΈμ¨μ΄μ λλ€. GPL (the GNU General Public License), LGPL (Lesser GNU General Public License) λλ BSD λΌμ΄μ μ€μ λ°λΌ μννΈμ¨μ΄λ₯Ό μ¬μ©, μ¬λ°°ν¬ν μ μμ΅λλ€. μμΈν λ΄μ©μ COPYING, GPL, LGPL, BSD κ° νμΌμ μ°Έμ‘°νμμμ€.