Log In
|
Sign Up
Search
NN, VV 태그만 추출하기
Writer
오창민
Description
tabbed.txt는 tab 문자로 구분된 파일이라고 가정(cf. https://khub.konantech.com/khub/attachement/336/(20190115)%20%EC%8A%A4%ED%81%AC%EB%A6%BD%ED%8A%B8%20%ED%8C%8C%EC%9D%BC_Tabbed.txt) ``` void main(string txtFile='tabbed.txt') { string line; for line in fopen(txtFile,'rb').read().trim().split('\n') { if (line.strstr('\t')<0) continue; string s = line.split('\t')[1]; list
res = kwd(s,'korean','utf8','std').trim().split('\n'); printf("%s\n=>\n", s); printz filter(lambda(y)(y.length()>0), map(lambda(x)( x.split().length()>0 && x.split()[1] in ['NN','VV'] ? ' '.join(x.split()[0:1]):""),res)); } } ``` ``` $ ./kql -f kql.rc -x "run s.k main('tabbed.txt');" 대화 => ['대화 NN'] 고맙습니다. 본인 보유 차량 위주로 여쭤 보도록 하겠습니다. 용도가 뭐에요? 차량 이용 용도? => ['고맙습니다 VV', '본 NN', '본인 NN', '보유 NN', '차량 NN', '위주 NN', '여쭤 VV', '보도록 VV', '용도 NN', '뭐 NN', '차량 NN', '이용 NN', '용 NN'] "출, 퇴근" => ['출 VV', '퇴근 NN'] 레저용 => ['레저 NN', '레저용 NN'] 업무에도 이용합니까? => ['업무 NN', '이용 NN'] ... ... ... ... 그거는 개인 취향 과걱하게 선 만이 해 놓은 것으 별로 안 좋아해서. => ['그거 NN', '개인 NN', '취향 NN', '과걱 NN', '선 VV', '만 NN', '만이 NN', '해 VV', '놓은 VV', '것으 NN', '좋아해서 VV'] ```
Tag
map filter 명사 동사 형용사
Module Name
Attachments
Comments
Save
Save
Cancel
Save
Cancel
Warning
Login