지난 3년간 참 많은 글을 썼는 데,
어떻게 생각해봐도 보물이라고 할 수 있다.
분량이 많기 때문에 무슨 짓이든 할 수 있다.
자체 검색엔진을 하나 만들고 test하기에도 적절한 분량이다.
모두 내가 기록한 내용이라서 내용을 알고 있고
여러 분야에 관한 내용도 있고 중복된 내용도 많으니
그동안 배운 Information Retrival 기법들을 적용해 볼 수도 있다.
"주요 단어 추출"
"단어 출현 빈도 추출"
"유사 문서 검색"
"유사 어휘 추출"
또한 여러 통계를 시험할 수도 있다.
"일간, 주간, 월간 글 수 변화량"
"일간, 주간, 월간 글의 평균 길이 변화량"
"글 작성 시간대 분석"
검색 엔진의 기능을 이용할만한 최소 size이고 인터넷처럼 방대하지 않아서
빠른 시간 내에 코딩과 디버깅, 구현, 분석을 할 수 있다.
@ 나중에 시간나면 해봐야지.
댓글 없음:
댓글 쓰기