태터데스크 관리자

도움말
닫기
적용하기   첫페이지 만들기

태터데스크 메시지

저장하였습니다.

사용자 삽입 이미지

제가 연구실에 있으면서 공식적으로 처음 만들었던 시스템입니다.

상품평이라는게 보는 관점에 따라서 좋은 말로, 또는 안 좋은 말로 판단 될 수 있습니다.

그래서 정확도 측정하는데 상당히 애를 많이 먹었습니다.

결국에는 카파테스트라는 검증을 사용해서 이 시스템이 실제 사람과 얼마나 유사한 판단을 하는지

테스트 하였는데, 그래도 봐줄만 한 정도로 나왔었습니다.

이 시스템은 단순히 구현을 넘어서..제 생애 첫 논문이 되었지요.

지금도 자연어처리를 열심히 공부하고 있는 학생이지만..지금 제 스스로 벌여놓은 일이 너무나 많네요.

그래도 매번 이런 "연구"를 하고 공부를 할 때 마다 기분은 좋네요^^;

실제로 사용해 볼 수도 있게 데모 사이트를 만들어 놨지만

한동안은 비공개로 해놔서, 저희 연구실 사람들만 데모 시스템을 사용할 수 있게 해놨었습니다.

하지만 오늘!.. 이 초라한 상품평 분류 시스템을 공개해보려고 합니다.

많이 사용해 주시고..코멘트도 달아주세요 ㅜ_ㅜ

업데이트 따위는 없습니다........(게으름뱅이..)

http://nlp.kangwon.ac.kr/~shin285/index.php

덧, 이 시스템을 공개하는 이유는 이보다 더 나은 성능의 시스템을 구현하려고 하는데 이에 대한 사용자들의 의견이 종합되어야 할 것 같다는 제 스스로의 판단 때문입니다.

ACL2009에서 나온 논문으로

여러가지 term weight 방법들을 비교하고 감정 분류 시스템에서 각 방법들을 평가하였다.

이 논문은 새로운 feature를 선택하는 방법이나, term weight를 주는 방법의 새로운 방법은 없었다.

이 중에서 눈여겨 봐야할 점은 각 term wieght model들을 조합하였는데,

좋은 성능을 낸 model 조합도 있었지만 오히려 성능이 저하되는 model 조합도 있었다.

그리고 여기에 대한 결론으로 corpus가 다르고 추정 파라미터의 값이 다르기 때문이라고

논문에서는 이야기하고 있다.

이 논문을 읽으면 실제로 감정 분류에 대해서 중요한 아이디어들을 얻을 수 있을 것이라 예상했지만,

단순히 모델들에 대한 소개와 실험, 그리고 각종 corpus 소개 등이 주를 이루고 있어서 조금 아쉬웠다.