태터데스크 관리자

도움말
닫기
적용하기   첫페이지 만들기

태터데스크 메시지

저장하였습니다.


요즘 트위터, 페이스북와 같은 SNS 사용자가 급등하면서 이를 오피니언 마이닝에서 이용하는 시도가 늘어나고 있습니다.

그 중 다음소프트라는 기업이 오피니언 마이닝 분야를 계속적으로 연구하고 있습니다.

지난 서울 시장 보궐 선거에서도 박원순 시장의 당선 유력을 조심스럽게 데이터로 뽑아서 사람들의 주목을 받았습니다.

 



실제로 박원순 시장이 당선 되면서 오피니언 마이닝에서 다음 소프트의 입지가 매우 높아진 것 같습니다.

그러나 아직까지 조심스럽게 진짜 "오피니언"은 제공하고 있지 않습니다.

기술력의 부족이라기 보다는 정치적인 성향과 잘못 판단 되었을 때의 리스크가 매우 크기 때문일 것입니다.

실제로 다음소프트의 연구진분들은 석,박사로 이루어진 브레인의 집합체라고해도 과언이 아닐 것입니다.

그러나 위험하더라도 "오피니언" 을 제공하지 않아서 이번 민주당 대표 선출시에 잘못된 결과가 나타났습니다.

바로 한명숙, 문성근의 싸움에서 문성근의 우세를 점쳤기 때문인데요.

이는 단순 SNS에서 언급되는 비율만을 갖고 측정하였기 때문에 위와 같은 결과를 점친것 같습니다.




실제로 문성근을 트위터에서 검색해보면 대부분 내용들이 부정적이라는 것을 확인할 수 있습니다.

언급된 비율이 정확히 얼마인지 알 필요가 없는 일반 사용자들에게 차라리 언급된 비율과 그 비율 중 긍정, 부정으로 분류하여 "랭킹" 개념으로 접근하였다면,

순위가 뒤집힐 수 있지 않았나 조심스럽게 생각해봅니다.

"언급률" 이라는 내용보다는 "지지율"이라는 단어로 변경하여 긍정, 부정에 대한 결과를 내부적으로 심어버린다면, 

서비스를 이용하는 사람들에게  긍정, 부정에 대한 결과를 직접적으로 제공하지 않더라도 한명숙 대표의 승리를 알 수 있지 않을까..하는 생각을 해봅니다.


물론 긍정, 부정을 분류하는 일이 쉬운일은 아닐 것입니다.

SNS라는 비정규화된 글의 형태.

이에 따른 각종 철자 오류 및 신조어.

개인의 의견에 따른 긍정, 부정의 상대적인 기준 등등..

국내를 대표하는 오피니언 마이닝 전문 연구소인만큼 앞으로도 많은 연구를 하셔서 저희에게 좋은 서비스를 제공해주셨으면 좋겠습니다 ^^


IIS를 이용한 파일 서버 구축

http://snoopybox.co.kr/1537
일반 C를 사용하여 Token을 하는 경우에는 그냥 strtok를 보통 사용하였습니다.

그러나 C++을 사용하게 될 때 구현하기 귀찮(?)아서 기존의 C 라이브러리 함수를 이용하게 되는데, 개인적으로

가장 자주 사용하는것이 strtok와 atoi입니다.

비주얼 스튜디오 2005 이후에서는 strtok를 이용하면 경고를 출력해줍니다.

이를 무시하고 코딩을 하는 경우가 많았는데........이를 무시하면 정말..무시무시한 디버깅의 세계로 빠져들 수 있으니 항상 조심하셔야합니다.


결론부터 말씀드리자면..strtok 함수는 비주얼 스튜디오 6.0 에서는 정상 작동하나, 그 이후 버전에서는

실행은 되지만 뒤에 쓰레기 값이 박히는 경우가 종종 발생합니다.

이를 대체하기 위해서 strtok_s를 이용하게 됩니다. 사용법은 아래 링크를 타고 가시면 됩니다.

출처 : http://harmonize84.tistory.com/112 

그런데 여기서 한가지 더 문제..strtok_s를 윈도우에서만 존재하는 함수라는 것입니다..

즉, 리눅스에서 같은 소스를 실행하면 에러가 난다는 것입니다.(물론 g++ 컴파일러 사용..)

그래서 다시 strtok로 변경하게 되면..쓰레기 값은 출력되지 않으나..자세히 보면 정상적인 출력이 아닌 경우가 발생합니다.

그래서 여기서 해결 방법은 strtok_r을 이용하는것입니다.

사용법은 man 페이지를 참고하세요 ~_~)~
자바 정규 표현식을 쓰다 보면 가끔
"날짜|이름|글|게시물번호"

이런식으로 " | "이 구분자가 되어 있는 경우가 다수 존재하고 있습니다.



솔직히 윈도우만 매번 쓰던 저에게는 split 인자에다가 "/|"를 주고는 했는데요..

오늘도 또 이런 실수를 범하고 말았습니다.

그런 의미에서 포스팅을 좀 해보고자 합니다.

포스팅을 해두면 잊어먹는 일은 없을테니까요..ㅎㅎ

String[] splitedLine = target.split("\\|");

이런식으로..하면 잘 되네요 ^^ 

이클립스에서 이런 저런 소스를 짜다보면 패키지 단위로 많이 사용하게 됩니다.

특히, 메인이 아닌 Util 개념의 소스들은 따로 보관을 해두었다가 그때그때 필요할 때마다 쓰곤 합니다.

역시나.. 이클립스는 완성도가 매우 높은 IDE 였습니다.

Export 하고자 하는 Package 위에 마우스 오른쪽 버튼을 누릅니다.

그 후에 Export를 선택합니다.


사용자 삽입 이미지


아래 그림과 같이 Archive File을 선택합니다.


사용자 삽입 이미지


그 후에 선택하고자 하는 패키지를 선택한 후,

Option에서 Created Only Selected Directories 체크해주면 됩니다.

사용자 삽입 이미지


참 쉽죠잉?!

저런 식으로 패키지 별로 소스를 모아놓으면 나중에 필요할 때 꺼내서 쓰기도 쉬울 것 같네요 ^^;;