육일약국 갑시다 - 10점
김성오 지음/21세기북스(북이십일)

제목만 보고 판단했을 때는 소설인가? 수필인가? 했다.
많은 블로거들이 이 책을 소개했을 때도 그런가보다 하고 말았지, 정작 내용은 보지 않았다.

연말, 연시에 휴가를 내고 쭉 쉬면서 책을 읽고 있는데, 눈에 들어온 책이 이 책이였다.
(아내가 이전 직장에서 읽을려고 가져왔다는데, 정작 읽어보지 않았단다.)
많은 사람들이 읽었다는데, 나도 한 번 가볍게 읽어볼까?라는 생각으로 집어든 책...

김성오 대표가 말하는 핵심은 "정직", "성실", "친절"을 바탕으로 한 "차별화"이다.
많은 경영 혹은 비지니스 서적들은 제무재표가 어떠해야 하며,
회사가 추구해야 하는 가장 큰 목적은 이윤을 남기는 것이어야 하고,
직원들은 어떻게 관리를 해야하며, 고객 관리는 어떻게 해야한다라는 류가 대부분인데 이 책은 의외였다.

첫 장 "육일약국 갑시다"는 정말 놀라웠다.
특별한 기술이 있는 것도 아니고, 그렇다고 남들보다 자본이 많은 것도 아니고
마산 변두리의 구멍가게보다 작은 4.5평의 육일약국을 알리는 방법이 그렇게 통쾌할 수가 없었다.
많은 이들이 사업을 하고자 하면, 많은 돈을 가지고 있어야 한다고 하지만,
김성오 대표는 자기가 가지고 있는 것을 최대한 활용할 줄 알았고,
고객들을 항상 기쁘게 해 줄 일을 찾아줄 줄 아는 사람이다.

읽으면서 이 분 언젠가 한 번 만나뵙고 싶다는 생각이 들었다.
정말 이런 분이라면 내가 많이 배울 수 있을 거 같다는 생각이 들었다.

모름지기 한국의 많은 회사들은 이윤 추구에 목을 메다보니 직원들과 고객들에 대해선 등한시하는 회사들이 많다. 경영진들은 나름한다고 하지만, 서로간의 신뢰가 쌓이지 않은 상태에서 말로만 떠드는 회사들이 많다. 물론 회사가 이윤 추구가 우선이 되어야겠지만, 나눔과 신뢰를 바탕이 되지 않은 회사는 존립하기 힘들다는 생각을 많이 했다.
이 또한 평소에 나도 가지고 있었던 생각이고, 직원들이 행복하지 않고 고객들이 행복하지 않은 상태에서 이윤을 많이 남긴다고 해서 그 회사는 좋은 회사일리 만무하다.
신뢰는 말로만 되는 것이 아니라, 몸소 경영진들이 보여주어야 할 덕목이다.

내가 만약 경영을 하게 된다면, 이 책을 열 번 더 읽어보고 시작할 것이다.
회사를 운영하는 많은 경영진들도 자기 배부터 채우기 보다는 나눔을 실천할 때 자기 배가 더 채워짐을 알아야 할 것이다.

*** 김성오님의 One Point Lesson ***

1. 아무리 좋은 아이디어라도 생각에 멈추면 '공상'에 불과하지만,
   몸을 움직이면 '행동'이 된다.
2. 결과가 빨리 나오지 않는다고 6개월이나 1년만 하고 말았다면, 일어나지도 않았을
   일이다. 하지만 남에게 피해를 주거나, 돈이 드는 일도 아닌데 못할 이유가 없다며
   나 자신을 다독였다.
3. 객관적인 경쟁력이 없으면, 주관적인 경쟁력이라도 만들어야 했다.
   그것 밖에 밑천이 없었다.
4. 아무리 사소한 것이라도 끊임없이 생각하고 탐구하는 자세는,
   남다른 경쟁력을 갖추는 데 중요한 역할을 한다.
5. 나는 현 상태를 유지하기보다 끊임없이 새롭게 변신하기를 꿈꾼다.
   사소한 시도라도 거듭하다보면 새로운 가능성이 열리기 때문이다. ... ... ...
   혁신을 방해하는 가장 큰 장애물은 바로 고정관념이다.
6. 자신만을 위해 아등바등거리는 삶은 항상 숨이 가쁘기 마련이다. 그러나 조금씩이라도
   남을 위하고 배려하다보면, 오히려 여유가 생긴다. 더불어 뿌듯한 보람과 사명감에
   더욱 열심히 일하는 자신을 발견하게 될 것이다.
7. 매일매일 정성껏 씨앗을 뿌리다보면, 오늘 거두는 열매도 있고 내일 거두는 열매도
   있게 마련이다. 여기서 중요한 것은 하루도 거르지 않고 씨앗을 뿌리는 것이다.
8. 주머니 사정이 여의치 않다면 정성과 시간, 노력을 주면 된다.
9. 사회가 발전할수록 소외되고 외로운 사람이 많기 때문에 감성적, 정서적으로
   편안함과 기쁨을 줄 수 있는 감동이 필요하다.
10. CEO는 고객을 감동시키기 전에 직원을 감동시켜야 한다.
11. '장사란 이익을 남기기보다 사람을 남기기 위한 것이다. 사람이야말로 장사로 얻을 수
   있는 최대의 이윤이며 신용은 장사로 얻을 수 있는 최대의 자산이다.'(거상 임상옥)
12. 나는 다른 회사의 능력있는 인재를 부러워하기보다는,
   내 식구를 더 큰 인재로 키울 수 있다는 믿음을 갖고 있다.
13. 동료는 라이벌이 아니라, 동반자인 동시에 격려자이며
   행복 에너지를 충전해주는 사람이라는 생각이 필요하다.
14. 새로운 것을 10개 시도할 경우 그 중 성공하는 것은 3개 정도다. 나머지 7개의 실패는
   내일의 성공을 위한 '기회비용'으로 생각하면 약이 되고 공부가 된다.
   인생 공부를 위한 수업료라고 생각해도 좋다.
15. 어제는 바꿀 수 없지만 오늘은 자신의 의지로 바꿀 수 있다. 생각을 실행하는 힘을
   키워야 할 때다. 꿈을 이루는 단 하나의 방법은 발로 뛰는 것이다.
16. 우수천석(雨垂穿石)이라고 끊임없이 떨어지는 작은 물방울은 돌도 뚫게 되어있다.
   아무리 어려운 상황일지라도 적극적인 돌파구를 마련하면, 해결되지 않을 문제는
   없을 것이다. 문제는 처한 환경이 아니라 우리의 자세이기 때문이다.
17. 이목이나 자존심, 혹은 체면에 발목을 잡히면 기회를 잡을 수 없다.
   기회 역시 지나가기 때문이다.
18. 씨줄과 날줄을 엮어야 천을 짤 수 있듯이 질과 양이 동시에 상승하는 노하우를 쌓으면
   웬만한 일에는 두려움을 느끼지 않게 된다. 문제는 성공의 크기에 연연하지 않고
   매일매일 경험을 쌓아나가는 것이다.
19. 나는 접대가 아닌 정성과 품질 그리고 정확한 납기일로 인정받으리라 마음먹었다.
   이는 지금까지 내 생존 방법이자 성공의 중요 요소이기도 하다.
20. 조금 답답하고, 느려보일 수 있는 신념이지만 정도의 길을 걷다보면 언젠가는
   그 진가가 발휘달 것이라 믿었다.
21. 자본의 선순환을 위해서라도 인간 관계의 선순환이 중요하다.
22. 기회라는 것도 마음에 여유가 있는 사람에게나 보이는 것이다. 늘 허둥지둥거리며
   시간에 쫓기다보면 결정적 순간에 어처구니없는 실수를 범할 확률이 높다.
   다급한 마음은 정확한 판단력을 흐트리고, 생각보다 행동을 앞서게 하기 때문이다.
23. '쓸 때 안 쓰면 더 크게 쓸 일이 생긴다'고 말씀하셨는데,
   이는 베풀어야 할 때 베풀지 않으면, 쓰지 않아도 될 일에 큰 돈이 나간다는 뜻이다.
24. 피하고 싶은 사람, 상대하기 싫은 사람일수록 친절하게 대해야 한다. 그 사람은 이미
   많은 곳에서 거부나 배쳑을 당했을 것이다. 때문에 복을 전해 주고 싶어도, 줄 수 있는
   기회를 잡지 못했을 가능성이 높다. 그런 사람에게 정성을 다하면 평소 주고 싶어도
   받아주는 곳이 없어 줄 수 없었던 복을 내려놓고 가는 것이다.
25. 내가 가진 작은 것에 충성하자. 작은 것에 만족하지 못하는 사람은 그 작은 것마저
   잃을 확률이 높다. 하찮고 작은 일이라도 마다하지 않는 사람은, 그것보다 조금 큰 일을
   할 수 있는 지혜가 생긴다. 노하우를 배웠기 때문이다.
26. 호흡이 거칠어질수록, 옷이 땀에 젖을수록, 정상과는 가까워졌다는 얘기다.
   하루에 오를 계단의 수를 정하고, 힘을 적절하게 안배하여 다소 벅차더라도 꾸준히
   노력하면 못 오를 곳이 없다. 시작은 하고 보는 사람, 시간은 다소 걸리더라도 포기하지
   않는 사람, 그리고 주위를 독려하며 올라가는 사람은 인생이나 사업에서 실패할 확률이
   적을 것이다.
27. '하고 싶은 일에는 방법이 보이고, 하기 싫은 일에는 변명이 보인다.'(필리핀 속담)
28. '저 사람들이 부자가 된 데에는 마땅한 이유가 있을 것'이라고 생각하며 '나도 언젠가는 성공하여 저 자리에 있으리라'고 다짐하곤 했다.
블로그 이미지

쩐의시대

나답게 살아가고 나답게 살아가자

,
유쾌한 행복사전유쾌한 행복사전 - 6점
최윤희 지음, 강일구 그림/나무생각

잠시 집중하면 금방 읽어버릴 수 있는 책이다.
그러나, 활자가 적다고 해서 금방 읽을 수 있는 것일까?
책을 읽는다는 것은 활자를 눈으로만 읽는 것은 아니고,
작가가 얘기하고자 하는 내용을 음미해야만 책을 제대로 읽는 것이 아닌가?
내용이 올바른 것인지? 잘못된 것인지?
그가 말하고자 하는 것이 이런 것인지? 저런 것인지?

나를 포함한 많은 이들이 활자를 눈으로만 읽고
피상적으로 느껴지는 것으로만 책을 다 읽었다고 표현하는 것은
책을 읽은 게 아니라, 활자만 읽은 것이리라...

올 목표 중 하나인 "마음에 올바른 양식 주기"가 그런 의미이다.
단순히 책의 활자만 읽는 것이 아니라,
작가가 전달하고자 하는 의미를 이해하고 음미하려는 노력...

새해에 이 책을 빼든 것은 "행복"이라는 단어 때문이다.
과연 내가 행복한지?
진정 내 영혼이 행복한지 되돌아보기 위함이다.

그러나, 책의 내용은 나의 기대에 약간 미치지 못한다.
사실, 이외수님의 활자에서 묻어나오는 깊이보다 조금 못한 거 같다.
그래도, 최윤희님의 삶에서 체득한 지혜를 어느 정도 볼 수 있는 책인 거 같다.

몇 가지 활자를 보자...
*** 최윤희님의 One Point Lesson ***
1. "생각은 화려하게~ 생활은 검소하게!"  그의 인생 철학은 절박한 현실, 남루한 현실 속
   에서도 찬란한 '행복의 극대치'를 누리고 살았던 간디의 모습을 선명하게 증언해준다.
2. 나는 아직까지 한 번도 행복을 만나본 적은 없다. 그러나 날마다 행복이란 녀석을
   껴안고 뒹굴면서 격렬한 포옹을 한다. 어디 그것 뿐인가? 찐한 입맞춤도 하면서
   별의별 짓을 다 하고 산다.
3. 얼굴의 유통 기간은 30분도 채 안 된다. 어묵은 일주일, 통조림은 최소한 일 년은 간다.
   30분도 안 되는 얼굴만 보고 섣불리 판단하지 말자. 딱 한 번, 그것도 몇 시간 만나보고
   어찌 그 사람의 '광활한 영혼'을 판단할 수 있겠는가?
4. 이 세상에 허구한 날 행복한 사람은 없다. 행복과 불행은 일란성 쌍둥이.
   항상 붙어 다니는 '세트 상품'이다. 아무리 행복한 사람도 슬픈 일이 있게 마련이고
   아무리 불행한 사람도 행복한 일이 있게 마련이다.
   어느 쪽을 바라보고 사느냐, 그것이 행복과 불행을 결정한다.
5. 대화의 기술엔 1, 2, 3 원칙이 있다.
   1분은 말하고, 2분은 듣고, 3분은 맞장구를 쳐주는 것이다.
6. 결혼이란 3개월 사랑하고 3년 싸우고 30년 참는 것이다.
7. Less is more.
   넘치는 것보다는 없는 것, 부족한 것이 때로는 더 나은 결과를 가져올 때가 있다.
8. 자신의 인생을 소신있게 살아가는 멋진 배짱은 보는 사람까지 기분이 상쾌해진다.
9. 우리 몸에 제일 중요한 것은 뼈다귀! 우리 마음에 제일 중요한 것은 깡다구!
10. 한 손은 너 자신을 돕는 손이고, 다른 한 손은 다른 사람을 돕는 손이다.
11. 부모가 자식을 키우는 데 필요한 4가지 요소는 4L.
   사랑(Love), 한계설정(Limits),
   정신적 이별과 독립(Let them go), 느슨한 간섭(Loose Integration)이다.
12. 사랑은 give & take지만 이해하는 것은 'under + stand'.
   다른 사람보다 아래 내려가 '서' 있는 것. 남보다 더 낮은 곳에 자기를 세우는 것.
   사랑보다 이해가 한 차원 더 승화된 감정이다.
13. 사랑도 경영이다. 행복도 경영이다.
   그러나 'hand made'가 아니라 'heart made'라는 것이 핵심 포인트!
14. 흐릿한 돌은 겨우 8번 깎였고, 빛나는 돌은 800번 이상 깎였던 것.
   우리 인생도 무수히 깎여야 한다.

http://danamoni.tistory.com2008-12-31T10:08:560.3610
블로그 이미지

쩐의시대

나답게 살아가고 나답게 살아가자

,

2008 & 2009 2008과 2009 사이에서 나를 바라보다

올 한 해 나는 블로깅에 심취했다.
블로그를 작년 8월경에 만들긴 했지만, 업무에 쫓겨 10개의 포스트도 남기지 못했다. 올해 회사를 옮기면서 약간의 시간이 나를 허락했었고,
소위 잘 나간다는 블로그도 방문해보면서 어떤 내용들이 있나 보기도 했습니다.
그러나, 지금 정작 나에게 중요한 것은 블로그를 통해 올 한 해 내가 관심있었던 건 무엇이며, 다가올 2009년엔 어떤 것에 집중할 것인지에 대한 되돌아볼 수 있는 흔적이 있다는 것입니다.


2008 나의 목표 5가지

사용자 삽입 이미지

1. 나만의 검색엔진 만들기 (업무관련)
2. 영어 표현 늘리기 (자기계발)

3. 블로그 열심히 하기 (나의 흔적 발견)

4. 마음에 올바른 양식 주기 (마음 공부)

5. 가족 사랑

1. 나만의 검색엔진 만들기 (60%)
다른 해에 비해 시간이 많이 주어졌음에도 불구하고 개인적인 일들이 많이 발생한 이유로 인해 진도가 많이 나가지 못했다. 색인 부분은 거의 작업을 끝내가는 상황이지만, 아직도 손을 많이 대야 하는 아쉬움이 남는다.
이젠 엔진에 필요한 인프라 기술은 대부분 작성이 되었기 때문에 어플리케이션에서의 작업을 통해 보완작업을 해 나가는 일이 남았다.

2. 영어 표현 늘리기 (20%)
젠장 회사를 옮기면서 기존에 수업을 같이 해 온 알렉스의 도움을 받지 못했다. 알렉스가 잘못했다기 보다는 이 또한 개인적인 이유로 수업을 같이 못했다. 대신 책을 보기 시작했지만, 성에 차지 않는다. 가끔 메신저로 알렉스와 얘기하지만 이전보다는 훨씬 못하다는 거...

3. 블로그 열심히 하기(90%)
소기의 목적을 달성한 일 중에 하나이다. 비록 좋은 포스트를 작성하지는 못했지만 나름 나만의 포스트를 작성했었구, 최근엔 티스토리 메인 화면에 나의 글이 소개되었으니 성공했다고 볼 수 있다. 게다가 연말에 좋은 이웃 블로거들도 생긴 거 같다.

4. 마음에 올바른 양식 주기(40%)
하반기 들어서 목표한 일인데, 마음에 양식 주는 작업은 그리 만족스럽지 못하다. 양식 주는 작업을 하다 부자가 되기 위해 박경철님의 '주식투자란 무엇인가?'라는 책에 몰두하면서 양식 주는 작업은 조금 멀리하게 되었다.

5. 가족사랑 (10%)
주말 부부인 나는 언제나 이 부분에 대해서는 만족스럽지 못하고 가족들에게 미안한 마음만 가득할 뿐이다. 내년에 6년간의 주말 부부 생활을 청산하고 같이 합칠 계획인데, 앞으로 지금까지 못한 사랑을 내년엔 듬뿍 해줄 수 있음 좋겠다.


2009 나의 목표 5 가지

1. 나만의 검색엔진 만들기

2. 영어 표현 풍성하게 만들기
3. 마음에 올바른 양식 주기
4. 가족 사랑
5. 번역 작업 마무리하기 

2008년 목표와 별다를 거 없다.
1번~4번까지는 2008년과 똑같고, 2008년 후반부터 슬슬 작업했던 번역 작업을 마무리하는게 목표이다.
블로그 열심히 하기는 목표를 달성했기 때문에 2009년에는 몸에 배인 습관으로 잘 할 수 있을 거 같은 생각이 들어 굳이 목표에서 제외시켰다.

1. 나만의 검색엔진 만들기
아마 2009년 상반기에는 결과를 볼 수 있을 거 같다. 중간 중간 결과물에 대해서 블로깅을 하겠지만, 나와 같이 하는 선배랑 작년 한 해 많은 고민을 하고 시행착오를 거쳤기 때문에 좋은 결과가 있으리라 본다.

2. 영어 표현 풍성하게 만들기
영어 표현을 풍성하게 만들기가 목표이긴 하지만, 나의 발음이 썩 좋지 않아 듣기가 약한 면이 있다. 일전에 '고수민님의 뉴욕 의사의 영어 공부 제대로 하기'를 소개했듯이, 그 방법들 중에 많이, 크게 소리내어 읽기를 통해 발음과 듣기에 집중을 할 것이며 그로 인해 자연히 얻어질 영어 표현에 최종 목표를 둔다.

3. 마음에 올바른 양식 주기
지금까지 출퇴근 시간에 지하철에서 주로 했던 것은 영어책 보기였다. 그러다 보니 눈으로 읽는 것은 가능했으나, 소리내는 것은 불가했기 때문에 이 시간대를 마음 공부하는 시간대로 변경할 것이며, 퇴근하고 난 다음에는 영어 공부하는 시간대로 변경해 보려 한다.
한 달에 2권 정도 읽을 수 있지 않을까...

4. 가족 사랑
2008년에 그나마 가족 사랑 중에 첫째 놈에 대한 사랑을 가장한 매를 하지 않았다. 내 맘대로 되지 않는다고 사랑을 가장한 매를 많이 이용했는데, 2008년엔 대화로 많이 풀었고, 굳이 필요하다면 팔 들기 정도로 끝냈다. 올해도 마찬가지일 것이며, 애들 키우느라 고생하는 아내에 대한 사랑도 듬뿍 줄 계획이다. 그 동안 떨어져 사느라 남편에 대한 사랑이 많이 부족했을텐데 구체적으로 어떻게 하겠다는 생각은 없지만, 이전보다 나은 모습을 보여줘야 하지 않을까?

5. 번역 작업 마무리하기 (Introduction to Information Retrieval )
목표 중에 이것이 심히 걱정되는 목표이다. 실력은 정말 미천한데, 순전히 나의 욕심으로 시작한 일이다. 검색엔진만 다룬지 10년이 넘었지만 머릿속에 남아 있는, 혹은 정립되어 있는 이론이 없어 늘 석박사들에게 논리적으로 밀렸기 때문에 시작한 작업이다. 막상 시작은 했으나, 갈수록 내가 비참해지는 거 같고, 오래갈 수 있을지 걱정되는 일이다.

 

2009 추가 목표

1. DIY 해보기
2. 공인중개사 도전하기
3. 가족들과 등산하기
4. 주식공부

1. DIY 해보기
내년에 입주할 아파트에 내가 직접 만든 가구를 들여놓고 싶다. 지금 얼핏 생각해 볼 수 있는 것은 식탁과 책장과 책상. TV 테이블 정도...
가능할 지 모르겠지만, 추가 목표로 만들어 본다.

2. 공인중개사 도전하기
직장 동료 중에 줄곧 같은 회사를  다닌 연배가 어린 동료가 있는데, 4~5년간의 도전 끝에 올해 결실을 봤다. 이젠 공인중개사가 메리트가 없다고 하지만, 나는 점점 나이가 먹어갈수록 지금 상황을 유지할 수 있을까라는 걱정이 들고, 무엇이라도 하나 해 놓고 싶은 생각이다.
일단, 시작은 한다...
최대 목표는 1차 시험 합격...

3. 가족들과 등산하기
어쩜 가족 사랑과 겹치는 부분이긴 하지만, 같이 등산을 자주 하고 싶다. 어려운 상황을 함께 헤쳐나가고 땀에 대한 결실도 애들이 느꼈으면 하는 바램이다...

4. 주식공부
이 공부는 어차피 꾸준하게 해야 하는 부분이고 이전부터 해왔던 공부라 목표라 하긴 그렇지만, 박경철님의 '주식투자란 무엇인가'라는 책을 정리하는 시간을 갖기 위한 것이다.
블로그 이미지

쩐의시대

나답게 살아가고 나답게 살아가자

,

(사진은 정확한 (원본) 출처를 찾기가 힘들어 다음과 네이버 이미지 검색에서 찾아 게시했습니다. 혹시 문제가 되면 삭제하겠습니다.) 

2008년~
정말 되돌아보기가 싫은 한 해이다...
내 개인적으로도 그렇고, 국가적으로도 그렇고... (저만 그런 건 아니죠???)
그런 가운데 우리에게 희망을 주고, 웃게 해주고, 행복하게 해 준 일들이 많다.

2008 베이징 올림픽에서 보여준 Korea, Team의 열정과 성과.
그리고, 박태환 선수와 더불어 많은, 열광적인 인기를 얻고 있는 김연아 선수...

언제 한 번 국민요정(정작 본인은 요정이라는 단어보단 여왕이라는 단어가 더 좋다고 당차게 얘기함.) 김연아에 대한 느낌을 작성해봐야겠다는 생각만 가졌다가
성탄절 자선아이스쇼인 "김연아의 엔젤스 온 아이스"를 보면서 역쉬~ 라는 생각으로
오늘에서야 드뎌 긁적거려본다.

내가 김연아 선수가 좋은 성적을 거두어서, 이쁘고 귀여워서 이 글을 작성하는 건 아니다.
언제(작년 초든가, 올해 초든가) TV에서 보여준 그녀의 인터뷰 내용을 보면서 진정 자기 일을 즐기고 있구나라는 느낌을 받았다.
그 당시 인터뷰 내용은 기억이 정확히 기억이 나지 않지만, 대충 이러했다.

"처음부터 너무 잘 해버리면 그걸 유지하기가 더 힘드니까 이번 시즌은 1등이나 2등을 하고 싶지 않았어요"

"선수들 다 넘어지고, 넘어진다고 큰 일 나느게 아니기 때문에, 그냥 이번에는 실수했고 저번에는 잘 했고 그런거지 남들 생각처럼 넘어졌다고 큰일 난 것처럼 생각하지 않아요."

고민이 별로 없어 보이는데? --> 사람은 고민이 없을 순 없잖아요? 다 있는거지..."

"특별히 누구를 이겨야 되겠다거나 시합 때 꼭 1등을 해야되겠다 이런 스타일은 아니예요? --> 네.. 그냥 최선을 다하자 그런 스타일이예요"

"10년 뒤의 모습은?  --> 선수 생활에서 정말 최고의 성적을 냈다면 프로로 전향을 해서 아이스쇼 같은 것도 할 수 있을 거 같고, 지금 생각으로는 그럴 거 같아요. 코치도 할 수 있고."

 소위 스포츠 엘리트 교육을 받는 한국 실정에서는 1등 아니면 아무 의미없는 것처럼 받아들인다. 2등이면 어떠하고, 3등하면 어떠하고, 설사 등수에 들지 않으면 어떠하리?

  이번 2008 베이징 올림픽에서 보여준 살인미소 이배영 선수를 보더라도 그는 우리에게 크다란 희망을 심어주고 국민적 영웅으로 떠올랐다.
또한, 유도 시합에서 최민호 선수에게 한판승으로 졌지만, 깨끗한 패배를 인정하고 상대방을 다독여준 오스트리아 출신인 파이셔 선수에 대한 국민적 열광은 1등만을 고집하는 한국 사회에 대한 반성이라 볼 수 있을 것이다.


  어쩜 사회적 병폐일수도 있겠지만, 1등만을 고집하지 않고 최선을 다한다는 얘기와 실수에 대해서도 아무렇지 않게 받아들일 수 있다는 것이 그녀는 진정 자기 일을 즐기고 있구나라는 것을 느끼게 되었다.

 이번 2008 ISU 피겨 스케이팅 그랑프리 파이널에서 감기로 인한 컨디션 난조로 쇼트 프로그램에서 1등을 했음에도 불구하고 프리스케이팅에서 밀리며 2위를 하였다.
그러나, 그녀를 좋아하지 않을 수 없다.
그녀의 얼굴엔 긴장감이 돌긴 했지만, 웃는 모습에 한결 내 마음이 밝아졌으니 말이다.

약 1주일이 지난 성탄절을 맞이하여 자선아이스쇼를 했다.
10년 뒤의 그녀의 모습이 될 거라고 했던 것을 10년 앞당겨 봤다.
그녀는 최신 유행하는 노래도 깜찍하고 가수 못지 않은 실력을 뽐냈고,
차세대 한국을 이끌어갈 피겨 스케이팅의 꿈나무들과 무대를 마련했다.
드러 그녀가 노래 부르는 모습에 안 좋은 시각으로 보는 사람들이 있다.
그녀를 연예인으로 만들지 마라~
실력도 안 좋으면서 하던 일이나 열심히 하지 연예인 짓거리를 할려구 하느냐?
...
모든 일에 대해서 당당하게 말하고 자신있게 말하며 즐길려는 그녀가 맘에 들지 않은 일에 대해서 그렇게 자연스럽게 행복한 얼굴로 아이스쇼를 했을까?
그 얼굴조차 연기라고?
당신이라면 하기 싫은 일인데도 그렇게 자연스러운 얼굴로 나설 수 있을까?

나는 그녀가 부럽다.
자기가 하고 싶은 일에 대해서 즐겁게 하고 그만큼 성과를 얻어 인정도 받으며
자신의 끼를 유감없이 발휘하는 진정한 프로의 모습이...

블로그 이미지

쩐의시대

나답게 살아가고 나답게 살아가자

,
시골의사의 주식투자란 무엇인가 2시골의사의 주식투자란 무엇인가 2 - 8점
박경철 지음/리더스북
1편 통찰편(시골의사의 주식투자란 무엇인가. 1:통찰 편)에 비해 읽기가 상당히 힘들었다.
2편 분석편은 1편에 비해 기술적인 내용을 많이 다루었다.
그렇다고, 세밀하게 기술한 건 아니지만, 보조지표에 대한 공부는 스토캐스틱에 대해서만 얼핏 본 나에겐 모든 것들을 역사로부터 시작하는 이론에 대해서 거부감이 생기는 건 어쩜 당연한 거 아닌가?
게다가 익숙하지 않은 용어들도 많았고,
반면 풀어쓴 글에서도 이런 용어들에 대해 거부감을 일으키는 나의 모습에
심히 화도 났다.
이러면서 무슨 주식 투자를 한다고...

어떤 이유에서건 나는 기술적 분석은 좋아하지 않았다.
기술적 분석은 말 장난이였고, 코에 걸면 코걸이고 귀에 걸면 귀걸이인 것이었다.
그냥, 이평선을 보고 앞으로의 추세를 파악하는 정도면 충분하다고 여겼다.

기술적 분석의 대가였던 시골의사 박경철님은 "주식투자란 무엇인가?"라는 1, 2권의 책을 통해 기술적 분석에 대해 비판을 하며 통찰을 강조했다.
그러나, 나는 왜 이 책을 읽으면서 기술적 분석에 대한 공부도 해 봐야겠다는 생각이 드는 것일까?

1편 통찰편을 읽으면서 나는 깊이도 없고, 그 얕은 지식으로 통찰 근처에 얼쩡거려보지도 않았지만 동감을 할 수 있었고, 2편은 힘들게, 힘들게 읽으면서 왜 이런 기술적 분석이 판을 치는지 속으로 욕을 하면서도 공부해야겠네 라는 생각이 든 이유는?
참으로 알다가도 모를 일이다.

각 보조지표마다 장단점이 있고 그 장단점을 잘 활용하고 통찰이 더해진다면 금상첨화일 것 이라는 생각이 든다.

그래서, 내가 생각하는 이 책의 핵심은 박경철님이 지적한 다음 내용이 아닐까 생각한다.

돌파 순간이 표준편차를 위협하는 강한 변동성의 구간은 아닌지, 
또 그 순간이 볼린저밴드가 크게 확장되어가는 변동성 강화 구간이라면
그것이 밴드 내에서 이루어지는 것인지, 밖에서 이루어지는지,
또 전자의 경우 보조지표가 과열권인지,
아니면 밴드를 강하게 이탈하면서 전고점보다 이격을 크게 벌려나가고 그 순간 보조지표가 초과열을 기록하는지,
또 고점을 돌파하는 시세의 각도가 느슨한지 예리한지를 교집합으로 연결지어 생각하는 것이다.

하나의 신호를 여러 각도에서 바라봐야만 실수를 최소한 줄일 수 있지 않을까?
내가 신이 아닌 이상 100%의 성공률을 확신할 수 없고
설사 100%의 성공률을 확신한다면 과욕이며 절대 주식 투자를 해서는 안 되는 일이다.

아주 긴 시간동안 지루함도 느꼈고,
나에 대한 반성도 많이 했고,
공부하지 않고서는 감히 주식이 어떠하다고 논할 수도 없다.

에필로그에서 말한 것처럼,
'우리 언젠가 금융시장에서 각자 성과를 낸 다음에 길거리에서 만나면, 한번쯤 손을 맞잡고 크게 웃는 날이 오기를 빌어보겠습니다.'
라는 기원처럼 나 또한 그와 길거리에서 만나 웃을 수 있는 날이 오길 기원해본다.

또한, 주식투자란 무엇인가에 대해 좋은 느낌을 그냥 느낌으로만 간직하기보다는
내년 1사분기 내로 간략하게 정리를 하면서 완전히 내 것으로 만들어 보리라.

** 관련 글 **
시골의사의 주식투자란 무엇인가. 1:통찰 편 (박경철 님)
시골의사의 부자경제학 (박경철 님)

http://danamoni.tistory.com2008-12-28T04:45:460.3810
블로그 이미지

쩐의시대

나답게 살아가고 나답게 살아가자

,
나는 내가 글 재주가 있다고 생각지 않는다.
아무래도 공대 출신이고, 경상도 놈이라서 더더욱 그렇다고 여긴다.
남들처럼 글을 재미있게 쓰지도 못할 뿐만 아니라 감동스럽게 쓰지도 못한다.
공대 출신답게, 경상도 놈답게 그냥 있는 사실을 나열할 뿐이다.
그래서, 가끔 다음.컴 메인에 올라오는 블로그들을 보면 참 부럽다는 생각을 많이 해봤다.

메인 화면에 노출이 되면서 많은 방문자가 생기고,
그 방문자로 인해 다시 웹상에서의 새로운 인연을 맺어가구,
그 인연들이 쓴 글을 통해 나의 사고도 넓혀가구...
물론, 꼭 방문자 수가 많아야 이렇게 할 수 있는 건 아니지만
이런 기회를 통해 좀 더 관심을 갖게 되고,
좀 더 포스팅에 있어 정성스러워질 수 있는 계기가 되지 않을까 하는 생각도 든다.

그들은 도대체 글을 어떻게 쓰길래 메인 화면에 노출이 될까?
많이 읽어봤지만, 딱히 뭐라 표현하는 거 보다 그냥 "재밌네~" 라는 느낌이 든다.
휴...
어쨌든, 나와 거리가 먼 일이었다.

그러던 22일 오후에 Tistory에서 댓글을 남겼다.


난, 이 댓글을 보고 내 눈을 의심했다.
어라?
그렇게 잘 쓴 글이 아닌 거 같은데...
그래서, 해당 포스트 (2008/12/18 - 산타와 버스) 를 몇 번이고 읽어봤다.

사실, 몇 번을 읽어 봤지만, 내 글이 메인 화면에 올라갈 정도의 글은 아니라 보여졌다.

오히려, 성탄절 관련한 다른 포스트들이 더 재미있었고, 잘 쓰여진 글이었다.
그러나, 떡하니 메인 화면 상단에 올라와 있다.
그것도 성탄절 관련 4개의 포스트 중에 제일 위에...


Tistory에서 머리에 총 맞은 건 아닐테구...
내가 바라보는 관점이 Tistory에서 바라보는 관점하고 어떻게 틀릴까??
나에게도 이런 일이 일어난 게 그저 신기할 따름이고 Tistory에 감사할 따름이다.

그러나, 나의 포스트가 Tistory 메인 화면에 올라온 희한한 사건을 살짝만 분석해 본다면...
1. 글이 길지 않다.
2. 있는 사실에 기초.
3. 느꼈던 부분에 대한 사진 첨부.
4. 일상에서 흔히 볼 수 있는 부분에 대한 감상.

모 이정도 일 것이다..

"우리 것이 최고"라는 말이 있듯이,
나의 글, 나의 문체가 내가 생각하는 것과 달리 좋게 봐주는 블로거도 있다라는 생각에
하나 하나의 포스트에 공을 들일 수 밖에 없는 경험이였다.

앞으로는 포스트 하나 하나 쉽게 얼렁뚱당 할 수 없을 거 같은 강박관념과 스트레스에 시달려야 할 수도 있겠다.

물론, 나의 글을 읽는 분들은 극소수이겠지만...
블로그 이미지

쩐의시대

나답게 살아가고 나답게 살아가자

,

어제 퇴근 길에 기분 좋은 일이 있었다.
그렇다고 해서 내가 대박이 난 것은 아니다.

그동안 서울 생활하면서 내 마음이 삭막해졌다고나 할까?
회사 생활, 나름 인간관계를 위해 동분서주하던 때가 많았던 거 같은데
왜 이렇게 마음은 삭막하고 메말랐는지...
이런 느낌을 새삼 되돌아보게 해주는 것이 있었다.
471번 버스.

우연찮게 얻어걸렸다고 하는게 정확한 표현일 것이다.
언남고등학교 앞에서 2호선을 타기 위해 강남역 방향 버스를 항상 제일 먼저 오는 버스를 탄다. G버스가 아닌 B버스만.. 그래야 환승하기가 편해서이다.

어제도 그 조건을 만족하는 버스가 471번 버스였다.
멀리서부터 오는데, 버스 정면이 화려하였다.

저건 모지?
가까이 올수록 괜시리 마음이 밝아졌다고 해야하나...
크리스마스 장식으로 한껏 멋 부리고 오는 것이 아닌가.
여태 서울에 살면서 본 적이 없었는데, 마냥 신기하고 어린 시절로 돌아가는 느낌이였다.
지금까지의 크리스마스라고 하면 먹고 마시고 즐기고의 느낌만 있었지
마음이 편해진다거나 따뜻해진다는 느낌은 없었던 건 사실이다.

사실 이 버스에 오르는 순간, 마음이 따뜻해졌다.
버스에 오르니 산타 할아버지가 운전석에 앉아 있지 않는가...

"어서 오세요~~~"
마치, "산타 나라에 오신 걸 환영합니다."라는 말로 느껴질 정도로 잠시 순수성을 찾았던 거 같았다.
그러곤 화려한 실내장식에 잠시 넋을 잃고 자리에 앉았다.
버스 앞부분과 천장, 뒷부분...
사랑이 느껴지고, 마음이 훈훈해지며, 뒷자리에 앉은 여성분들은 좋아라 웅성웅성...

아들 놈이 이제 어린이집을 다니기 시작하며 산타 할아버지를 운운하던 생각이 나서 아들 녀석과 영상통화를 시도하였다.
"우와~ 멋있다."
"크리스마스 장식~"
딸래미도 보더니, 잘 알아듣지는 못하겠지만서두 (아직, 옹알이 수준이라서)
"우~웅"
"아빠, 아빠!!! (멋있어~)"

버스 안이라서 길게는 통화하지 못했지만, 이런 화려한 모습을 보고 마냥 즐거워하는 녀석을 보니 내가 그동안 이 놈들한테 무심했나 싶기도 했다.

사실 크리스마스라고 선물을 준 적이 없다.
크리스마스를 알 리도 만무하고...
그러나, 요즘 부쩍 선물이라는 개념도 알고 크리스마스에 산타 할아버지가 오신다고 믿는 놈을 보니 올해는 크리스마스 선물을 준비해야겠다.

세부 장식들을 찍어보았다.
왼편 앞쪽에 트리와 사슴 장식,
출입구 쪽에 범선 장식,
오른쪽 앞쪽에 인형과 각종 악세사리 장식...
20여분간의 짧은 산타 나라로 여행을 한 여운이 가시지 않았다.
하차를 하고 강남역으로 가는 도중에 Meritz 건물에도 크리스마스 분위기가 물씬 풍기는 장식을 해 놓았길래, 또 영상통화를 시도...

아들 녀석 또 감탄을 연발한다.
"아빠, 저건 XXX 같아요~~"
"멋있다."
"엄마, 아빠한테 가고 싶어~"
딸래미두 보더니 감탄을 역시 마다하지 않았다.
딸래미가 보고 있는 순간에도 아들 녀석은
"아인아, 줘봐~ 오빠가 보게..." 라고 재촉한다.

비록, 직접 보여주지 못하고 문명의 혜택을 받으며 영상통화로 보여주긴 했지만,
나의 2세들이 즐거워 하는 모습에 잠시나마 행복했었다.

행복이라는 게 멀리 있지 않고, 이런 소소한 것들이 나에게 행복임을 새삼 다시 느끼게 된 좋은 계기였고, 이런 행복을 선사해준 산타와 버스에게 감사드린다.

블로그 이미지

쩐의시대

나답게 살아가고 나답게 살아가자

,
첫 번째 Chapter의 마지막 부분입니다.
에구구, 얼마되지도 않는 양인데두 번역을 한다는 것이 만만하지는 않네요..
앞으로 가야할 길은 까마득한데 끝까지 갈 수 있을지 걱정스럽습니다.

1.4 The extended Boolean model versus ranked retrieval

  Boolean 검색 모델은 사용자들이 주로 자유로운 텍스트 쿼리 (free text query)를 사용하는 Vector Space 모델 (Section 6.3)과 같은 랭킹 검색 모델과 대조된다. Vector Space 모델은 즉, 하나 또는 그 이상의 단어를 타이핑하는 것이 쿼리 표현을 만드는 연산자를 가진 정확한 언어를 사용하는 것보다 낫고, 시스템이 쿼리를 최대한 만족하는 문서를 결정한다. 랭킹 검색의 장점에 대한 수 십년간의 학술적인 연구에도 불구하고, Boolean 검색 모델을 구현하고 있는 시스템들이 주를 이루었고, 대규모 상업적 정보 제공자들에 의해 검색 옵션만을 1990년 초반 (대략 World Wide Web의 출현시점)까지 30년동안 제공되었다. 그러나 이러한 시스템들은 지금까지 제공되어진 기본적인 Boolean 연산자들( AND, OR, and NOT)을 제공하지 않았다. 정렬되지 않은 결과 집합을 갖는 term들간의 엄격한 Boolean 표현은 사람들이 필요로 하는 많은 정보를 제한시켰다. 그리하여 이러한 시스템은 근접 연산자와 같은 추가적인 연산자에 의해 확장된 Boolean 검색 모델을 구현하였다. 근접 연산자는 쿼리의 2개의 term들이 하나의 문서에서 서로 가까이 출현해야 한다는 조건을 지정하는 하나의 방법이다. 근접은 단어들간의 존재할 수 있는 단어의 숫자를 제한하거나 문장이나 문단과 같은 구조적인 단위를 참조함으로써 측정되어질 수 있다.

  Example 1.1 영리 목적의 Boolean 검색 : Westlaw. Westlaw(http://www.westlaw.com)은 50만 이상의 유료회원들이 수 십 terabyte 이상의 텍스트 데이터에 대해서 매일 수 백만의 검색을 수행하는 최대 규모의 법률 검색 서비스이다. (유료 회원의 수를 기준으로) 이 서비스는 1975년부터 시작되었고, 자유로운 랭킹 텍스트 쿼리 형식(westlaw에 의하면 Natural Language라 불리움)이 1992년에 추가가 되었음에도 불구하고 2005년에도 Boolean 검색 (Westlaw에 의하면 Terms and Connectors라 불리움)은 여전히 디폴트였고, 대다수의 사용자가 사용하였다. 여기에 Westlaw상의 몇몇 Boolean 쿼리의 예제가 있다.

    Information need : Information on the legal theories involved in preventing the
             disclosure of trade secrets by employees formerly employed by a competing
             company
             (이전에 경쟁회사에 근무하던 고용인에 의한 영업기밀의 폭로에 방지할 수 있는
              법적 이론에 대한 정보)
    Query : "trade secret" /s disclos! /s prevent /s employe!

    Information need : Requirements for disabled people to be able to access a
             workplace.
             (장애인들이 직장에 접근할 수 있도록 하기 위한 요구사항)
    Query : disab! /p access! /s work-site work-place(employment /3 place)

    Information need : Cases about a host's responsibility for drunk guests.
             (취객에 대한 호스트의 응대에 대한 사례)
    Query : host! / p (responsib! Liab!) /p (intoxicat! Drunk!) /p guest

  웹 검색에서 일반적이지 않은 길고 정확한 쿼리와 근접 연산자의 사용에 주의하라. 보내진 쿼리는 평균 길이는 약 10단어이다. 웹 검색의 일반적인 형태와 달리, 단어들간의 스페이스는 분리를 나타낸다. (가장 빡빡한 접합 연산자), &는 AND이고, /s, /p, /k는 같은 문장, 같은 문단 혹은 k 단어 내에서 매칭을 요구하는 것이다. 큰 따옴표(" ")는 문장 검색(연속적인 단어)을 제공한다. Section 2.4(page 36)을 참고하자. 느낌표(!)는 후행 와일드 카드 쿼리를 제공한다. (Section 3.2 page 48를 참조하자). 그러므로 liab!는 liab로 시작하는 모든 단어와 매칭하는 것이다. 게다가 work-site는 worksite, work-site 또는 work site 중 어느 것과 매칭하는 것이다. Section 2.2.1을 보자. 전통적인 전문가 쿼리는 보통 새심하게 정의되어졌고, 점진적으로 그들이 사용자에게 좋은 결과를 보여줄 때까지 개발을 했다.

  많은 사용자들, 특히 전문가들은 Boolean 쿼리 모델을 더 선호한다. 하나의 문서는 쿼리와 매치한다. 그렇지 않다와 같이 Boolean 쿼리는 정확하다. 이것은 무엇이 검색되어지는 것 이상으로 사용자들에게 더 많은 제어와 투명성을 제공한다. 그리고 법적 자료와 같은 몇몇 영역은 Boolean 모델 내에서 효과적인 의미의 문서 랭킹을 인정한다. Westlaw는 실제 꽤 효과적인 최근 연대순으로 문서를 제공한다. 2007년 대부분의 법률 사서는 높은 재현율을 위해 여전히 terms and connector를 추천하는 것처럼 보인다. 그리고 대부분의 법률 사용자들은 그것들을 사용함으로써 더 큰 제어를 획득할 수 있다고 여긴다. 그러나 이것은 전문가 검색을 위해 Boolean 쿼리들이 더 효과적이다라는 걸 의미하지 않는다. 실제적으로 Westlaw의 하부 컬렉션에서 경험함 Turtle(1994)은 경험에 의해 필요한 대다수의 정보에 대해 Westlaw의 레퍼런스 사서들에 의해 준비되어지는 Boolean 쿼리보다 자유로운 텍스트 쿼리(free text queries)가 더 나은 결과를 산출해 내는 것을 알았다. Boolean 검색이 가지는 일반적인 문제는 OR 연산자는 낮은 정확도와 높은 재현율을 제공하는 반면 AND 연산자는 높은 정확도와 낮은 재현율을 산출하는 경향이 있다는 것이다. 그리고 만족스러운 중간 지역을 찾기가 어렵거나 불가능하다.

  이번 chapter에서 우리는 dictionary와 posting list를 포함하는 기본적인 역색인의 구조와 구조물을 보았다. 우리는 Boolean 검색 모델을 소개했고, 선형 시간의 병합을 통해 효과적인 검색을 수행하는 방법과 간단한 쿼리 최적화를 시험했다. Chapter 2-7에서, 우리는 더 많은 쿼리 모델과 효과적으로 다룰 필요가 있는 증가하는 색인 구조의 종류에 대해서 상세히 고려한다. 여기서 우리가 할 수 있는 것들에 대해 몇몇 중요한 추가적인 것들에 대해 말하고자 한다.

1. 우리는 dictionary에서 term의 집합들에 대해 좀 더 나은 선택을 하고자 하고 철자 오류와
   일치하지 않는 단어의 선택에 대해서 관대한 검색을 제공하고자 한다.
2. "Operating system"과 같은 개념을 기술하기 위한 복합어나 구에 대해 종종 검색하는 것이
   유용하다. Westlaw 예제에서 보는 거처럼, 우리는 또한 Gates NEAR Microsoft와 같은
   근접 쿼리를 수행하기를 원한다. 그런 쿼리에 대한 답변은 색인이 문서 내에서 term들의
   근접을 알아내기 위해 늘어나야 한다.
3. Boolean 모델은 단지 term들이 존재하거나 하지 않거나를 기록하지만, 종종 우리는 단지
   한 번만 출현한 문서에 반해 term들이 몇 번 출현한 문서에 좀 더 많은 가중치를 줄 수 있는
   기록을 가지길 원한다.
4. Boolean 쿼리는 단지 매칭하는 문서의 집합을 검색하지만, 일반적으로 우리는 리턴되는
   결과를 정렬화(또는 랭킹화)하는 효과적인 방법을 가지길 원한다. 이런 요구는 문서 점수를
   결정하기 위한 쿼리에 대한 문서를 적절히 매치시키는 캡슐 메커니즘을 가지고 있다.

이러한 추가적인 아이디어를 가지고, 우리는 비정형화된 정보에 대한 Ad-hoc 검색을 지원할 대부분의 기본적인 기술을 보게 될 것이다. 전체 문서의 Ad-hoc 검색은 최근 웹 검색 엔진뿐만 아니라, 대규모 e커머스 웹 사이트에 있는 비정형화된 검색 부류에서도 세계적으로 공략하고 있다. 주요 웹 검색 엔진들은 자유로운 텍스트 쿼리(free text querying)을 강조함에 차이가 있음에도 불구하고 뒤에 나올 chapter에서 보게 될 거처럼 대부분의 기본적인 이슈들과 색인 기술들과 쿼리들은 그대로 유지된다. 게다가 시간이 흐름에 따라 많은 웹 검색 엔진들은 가장 인기있는 확장 Boolean 모델의 연산자들에 대해 부분적인 구현들을 추가하고 있다. 그럼에도 불구하고, 이러한 옵션들은 검색 전문가들이 선호함에도 그들은 대다수에 비해 적게 사용하고 있고, 웹 검색 엔진의 성능을 향상시키기 위한 주요 포커스가 아니다.

Exercise 1.12  Westlaw 구문법을 사용해서 똑같은 문장 내에서 몇몇 단어인 professor, teacher, lecturer 를 찾는 쿼리를 작성하라.

Exercise 1.13  2개의 주요 웹 검색엔진에서 Boolean 검색 특징을 사용해봐라. 예를 들어, burglar와 같은 단어를 선택 후, (i) burglar, (ii) burglar AND burglar, (iii) burglar OR burglar라는 쿼리를 수행하라, 예측되는 결과 수와 이것의 상위 히트수를 봐라. 그것들이 Boolean 논리에 의해 수행되었는가? 종종 그것들은 주요 검색엔진에 없다. 여러분들은 어떻게 수행되었는지 이해를 할 수 있는가? 만약 여러분들이 다른 단어를 사용했다면 어떠한가? 예를 들어, (i) knight, (ii) conquer, (iii) knight OR conquer와 같은 쿼리. 세 번재 쿼리에 비해 첫 2 쿼리에 대한 결과 수의 범위는 어떠한가? 이러한 범위를 인정하는가?

1.5 References and further reading

정보 검색을 전산화하기 위한 실제 연구는 1940년 후반부터 시작되었다. (Cleverdon 1991; Liddy 2005). 전통적인 저널 논설보다는 훨씬 비공식적인 기술 보고서인 과한 문헌의 급증이 컴퓨터의 가용성으로 이어졌고, 자동 문서 검색에 대한 관심을 주도하였다. 그러나, 그 당시에는 문서 검색은 항상 작가, 제목, 키워드들이 기초가 되었다. Full-text 검색은 훨씬 후에 나왔다.
Bush(1945)의 논설은 새로운 영역에 대해서 지속적인 영감을 제공하였다.

    기계화된 개인 파일과 라이브러리와 같은 개인적으로 사용하는 미래의 장치를 고려해보면
    이름이 필요하고 랜덤하게 하나를 창조한다. 'memex'라는 기계가 할 것이다. memex는
    모든 책과 기록, 대화를 개인적으로 저장할 장치이다. 굉장한 속도와 가연성을 지니고
    컨설팅해주기 위해 기계화되어진다. 그의 기억에 대한 친밀한 지원은 확대되어진다.

정보검색이라는 term은 1948/1950년에 Calvin Mooers라는 사람에 의해 만들어졌다. (Mooers 1950).
1958년 많은 신문은 IBM의 H.P.Luhn의 업적에 우선적으로 기초한 "자동 색인(auto-indexing)" 기계 컨퍼런스의 시연에 주목했다. 상업적 관심은 Boolean 검색 시스템에 대해서 재빨리 매혹되었다. 그러나, 초기에 검색 시스템에 대한 여러가지 이질적인 기술 전반에 대한 무모한 논쟁을 보았다. 예를 들어, Mooers(1961)는 의견을 달리했다.

    여러가지 검색 하드웨어에 몇 백만 달러의 투자에 서명했다는 것은 일반적인 잘못된
    생각이다. George Boole(1847)의 대수학은 검색 시스템 설계에 대한 적절한 형식이라는
    이러한 관점은 잘못된 만큼이나 넓게, 무비판적으로 받아들였다.

AND 대 OR은 정확도/재현율 트레이드오프에서 정 반대적인 현상을 보여주나, 절충 영역은 생겨나지 않는다. (Lee and Fox 1988)
(역자주: 트레이드오프(tradeoff). 어느 것을 얻으려면 반드시 다른 것을 희생하여야 하는 관계)

책(et al, 1999)은 역색인과 다른 가능한 데이터 구조체의 공간과 시간 효율성에 있어서의 철저한 경쟁에 대한 표준 레퍼런스이다. 좀 더 간결하고 최신의 발표는 Zobel과 Moffat에서 나왔다(2006). 우리는 향후 Chapter 5에서 몇몇 접근법에 대해 논의한다.

** 이전 글 **
Introduction
1.1 An example information retrieval problem
1.2 A first take at building an inverted index
1.3 Processing Boolean queries

** 다음 글 **
2. The term vocabulary and postings lists (2.1 Document delineation and character sequence decoding)
블로그 이미지

쩐의시대

나답게 살아가고 나답게 살아가자

,
휴, 간만에 올립니다...
올리는 주기를 보니 주말을 제외하고 4~5일에 한 번씩 올리는군요..
좀 더 속도를 내고 싶지만, 여건이 제한되어져 있어서...

1.3 Processing Boolean queries

우리는 역색인과 기본 Boolean 검색 모델을 이용하여 질의어를 어떻게 처리할까? 간단한 결합 질의(conjunctive query)를 처리하는 것을 고려해보자.

(1.1)  Brutus AND Calpurnia
        위 역색인은 부분적으로 페이지 6의 그림 1.3에서 보여준다.
        1.  dictionary에서 Brutus를 찾는다.
        2.  Brutus와 관련된 posting을 검색한다.
        3.  dictionary에서 Calpurnia를 찾는다.
        4.  Calpurnia와 관련된 posting을 검색한다.
        5.  그림 1.5에서 보여주는 것처럼 두 posting list에서 교집합을 구한다.
        
 

교집합 연산을 구하는 것은 중요하다. 우리는 2개의 term을 포함하고 있는 문서들을 빨리 찾을 수 있도록 하기 위해 posting list들을 효과적으로 교차 연산할 필요가 있다. (이 연산은 때론 posting list들을 합병하기 위해서도 참조가 되는데, 조금 직관적이지 않은 이런 이름은 일반적인 알고리즘 군에서는 각각의 포인터를 전진시키며 끼워 넣는 정렬된 리스트들을 결합시키는 term 합병 알고리즘이라는 이름으로 알려졌다. 여기서 우리는 논리적인 AND 연산을 가지고 리스트들을 합병하고 있다.)

 그림 1.6에서 보면 합병 알고리즘을 사용해서 posting list들의 교차하는 간단하고 효과적인 방법이 있다. 우리는 2개의 리스트 포인터를 유지하고 2개의 posting list들의 모든 엔트리들을 선형적으로 동시에 순회한다. 각 단계에서 우리는 두 포인터가 가리키는 docID를 비교한다. 만약 그것들이 같다면, 결과 리스트에 해댱 docID를 삽입하고 두 포인터를 전진시킨다. 그렇지 않다면, 더 작은 docID를 가리키하는 포인터를 전진시킨다. 만일  posting list의 길이를 x와 y라고 한다면, 교집합의 복잡도는 O(x+y)를 가진다. 공식적으로 질의어의 복잡도는 Θ(N)이다. 여기서 N은 컬렉션에서의 문서 개수이다. 색인 방법은 상수를 획득한다. 선형 스캔과 비교하는 Θ 시간 복잡도에서의 차이가 아니라, 실제로 상수는 엄청 크다. Posting은 단독 전역 순서에 의해 정렬되어진다는 것은 중요하다. docID에 의한 숫자 정렬을 사용하는 것은 이러한 것들을 이루는 것에 대해서 하나의 간단한 방법이다.

우리는 다음과 같은 좀 더 복잡한 질의어를 처리하기 위해 교집합 연산을 확장할 수 있다.

(1.2)  (Brutus OR Caeser) AND NOT Calpurnia
질의어 최적화는 답변 작업을 전체 작업량이 시스템에 의해 행해지는 것을 최소화하기 위해 어떻게 구조화할 것인가를 선택하는 과정이다. Boolean 질의어에 대한 주 요소는 어떤 posting list를 접근할 것인가에 대한 순서이다. 질의 처리에 대한 최선의 순서는 무엇인가? term들에 대한 AND 질의어를 고려하자. 예를 들면,

(1.3)  Brutus AND Caeser AND Calpurnia
각 term들은 posting을 획득할 필요가 있고, 그것들 모두 AND 연산을 취한다. 표준적인 방법은 document frequency가 증가되는 순으로 term들을 처리하는 것이다. 만일 우리가 2개의 제일 작은 posting list들의 교차 작업을 시작한다면, 중간 산출물은 제일 작은 posting list보다 더 클 수 없는 것이 자명하고, 따라서 전체 작업량은 최소한으로 이루어질 거 같다. 그래서 페이지 6의 그림 1.3에서의 posting list들에서 우리는 아래의 질의어처럼 실행한다.

(1.4)  (Calpurnia AND Brutus) AND Caeser
이것이 dictionary에서 term frequency를 가지는 첫 번째 이유이다. 어떤 posting list를 접근하기 전에 메모리상의 데이터에 기초하여 이러한 정렬을 위한 결정을 할 수 있게 해준다.

(1.5)  (madding OR crowd) AND (ignoble OR strife) AND (killed OR slain)
이전에 처럼, 우리는 모든 term에 대해서 frequency들을 획득하고 그로 인해 따로 존재하는 frequency들의 합에 의해 각 OR의 사이즈를 예측할 수 있다. 떨어져 있는 각 term 사이즈의 증가 순에 의해 질의를 처리할 수 있다.

임의의 Boolean 질의어에 대해서 우리는 복합적인 표현으로부터 중간 표현에 대한 답을 일시적으로 평가하고 저장해야 한다. 그러나, 많은 상황에서 사용자가 던져주는 질의어는 자연어이거나 질의어의 가장 일반적인 형태이기 때문에 질의는 순수한 결합어이다. 이런 경우에 2개의 입력과 서로 다른 출력을 가진 기능으로서 posting list를 병합하여 보여주는 것보다 적어도 빈번한 term들의 posting list를 적재하여, 중간 결과물을 초기화할 수 있는 메모리상에서, 현재의 중간 결과를 가지고 검색되어진 각각의 posting list들간의 교집합을 구하는 것이 더 효과적이다. 이 알고리즘은 그림 1.7에서 보여준다.

교집합을 구하는 연산은 비대칭이다. 중간 결과물 리스트는 디스크로부터 읽어들이며 교집합을 구하는 동안 메모리상에 있다. 게다가 중간 결과물 리스트는 항상 최소한 다른 리스트만큼 짧아야 한다. 대부분의 경우에서 크기가 작은 순이다.

 Posting 교집합은 여전히 그림 1.6의 알고리즘에 의해 행해지지만, 리스트들의 길이간의 차이가 매우 클 때, 대체 기술을 사용할 기회가 생긴다. 그 교집합은 중간 결과물 리스트에서 파괴적으로 수정을 하거나 유효하지 않은 아이템을 표시함으로써 적당히 계산되어질 수 있다. 또는 중간 결과물 리스트의 각 posting list에 대해 긴 posting list 내에서 연속적인 binary search로 수행될 수 있다. 다른 가능성은 중간 결과 아이템의 구성원들은 시간 복잡도가 선형 또는 로그 시간보다 더 나은 상수로 계산되어질 수 있는 해시테이블처럼 긴 posting list를 저장하는 것이다. 하지만, 그런 대체 기술은 Chapter 5에서 논의될 부류의 posting list 압축과 결합시키기가 어렵다. 게다가 보통 posting list 교차 연산은 질의의 두 term이 매우 일반적일 때라는 필요성을 남긴다.

Exercise 1.4  아래의 질의에서, x와 y는 Brutus와 Caeser에 대한 posting list의 길이라고 하면 우리는 여전히 시간 복잡도 O(x+y)로 교차 연산을 수행할 수 있는가? 만일 할 수 없다면, 우리는 무엇을 획득할 수 있는가?
         a. Brutus AND NOT Caeser
         b. Brutus OR NOT Caeser

Exercise 1.5  posting 합병 알고리즘을 임의의 Boolean 질의 방식으로 확장해보자. 시간 복잡도는 어떻게 되는가? 예를 들어, 
         c. (Brutus OR Caeser) AND NOT (Antony OR Cleopatra)
          우리는 항상 선형 시간으로 합병할 수 있는가? 어디에서 선형적인가? 이것보다 더
          나은 방법이 있는가?

Exercise 1.6  우리는 재작성된 질의를 AND와 OR에 대해 분배 법칙을 사용할 수 있는가?
         a. Exercise 1.5에서 질의를 분배법칙을 사용해서 분리된 일반적인 형태로 어떻게 재작성하는지 보여라
         b. 결과 질의는 원 형태보다 효과적으로 평가되어질 수 있을까? 없을까?
         c. 이 결과는 일반적으로 사실인가? 또는 문서 컬렉션의 단어와 본문에 의존하는가?

Exercise 1.7  질의를 처리하는 순서를 설명하라.
         d. (tangerine OR trees) AND (marmalade OR skies) AND (kaleidoscope OR eyes)
         다음과 같이 posting list의 사이즈가 주어졌다.
                            Term                   Posting Size
                       eyes                            213312
                       kaleidoscope                  87009
                       marmalade                   107913
                       skies                            271658
                       tangerine                       46653
                       trees                            316812

Exercise 1.8  만일 질의가
         e.  friends AND romans AND (NOT countrymen) 이라면,
           우리는 가장 좋은 지의 평가 순을 평가하는데 있어서 counrymen의 빈도수를 어떻게
           사용할 수 있을까? 그 중에서도, 질의 처리의 순서를 결정하는데 있어서 부정
           (negatition)을 다루는 방법을 제안하라.

Exercise 1.9  인접 질의에 대해서, 사이즈에 따라 posting list를 처리하는 것이 최적화를 보장하는 가? 그렇다면 왜 그런지 설명을 하고, 그렇지 않다면 예제를 보여라.

Exercise 1.10  posting 합병 알고리즘을 그림 1.6 (페이지 11)의 형태로 작성하라. x와 y는 질의어.

Exercise 1.11  Boolean 질의 x AND y는 어떻게 다루어지는가? 왜 이런 질의의 원시적인 평가가 매우 비싼 대가를 치루어야 하는가? 이런 질의를 효과적으로 평가하기 위한 posting 합병 알고리즘을 작성하라.

** 이전 글 **
Introduction
1.1 An example information retrieval problem
1.2 A first take at building an inverted index

** 다음 글 **
1.4 The extended Boolean model versus ranked retrieval
1.5 References and further reading
블로그 이미지

쩐의시대

나답게 살아가고 나답게 살아가자

,
아직 시작 단계인데, 벌써 겁이 나기 시작합니다.
너무나 미약한 영어 실력에 막히는 곳이 한 두 군데가 아니고,
우리말로 표현하자니 의미 전달이 잘 안 되는 단어들도 존재하구...
직역을 고집하여 작성을 하고 있으나, 의역이 필요한 곳도 있고...
새삼 번역 일이라는게 쉽지 않은 일이구나 라는 걸 느낍니다.

1.2 A first take at building an inverted index

검색시 색인 속도에 대한 이점을 획득하기 위해 우리는 향상된 색인을 구축해야 한다. 이것은 중요한 단계들은
   1. 색인되어질 문서들을 수집 
     

   2. 텍스트들을 토큰화, 각 문서들을 토큰들의 리스트로 변환
     

   3. 언어학적으로 전처리, 색인화될 term들의 일반화된 토큰들의 리스트로 처리
     

   4. dictionary와 posting들로 구성된 역색인을 구축하는 것으로 각 term이 발생하는
      문서를 색인

우리는 앞선 처리 단계(1-3 단계)에 대해서 Section 2.2에서 정의하고 논의한다. 그때까지 여러분들은 토큰들(tokens)과 일반화된 토큰들(normalized tokens)을 단어들(words)과 대충 유사하다고 생각할 수 있다. 여기서, 우리는 첫 3개의 단계가 벌써 이루어졌다고 가정을 하고 정렬화된 색인에 의해 기본적인 역색인을 구축하는 것을 시험한다.

 문서 컬렉션 내에서 우리는 각 문서가 document identifier(docID)라고 알려진 유일한 순차적인 숫자를 가진다고 가정한다. 색인 구축 동안 우리는 간단하게 연속적인 정수를 처음으로 만나게 되는 각 문서에 할당할 수 있다. 색인 생성시 입력 값은 그림 1.4와 같이 term과 각 문서의 쌍의 리스트로서 생각할 수 있는 각 문서에 대해 일반화된 토큰들의 리스트들이다. 핵심 색인 단계는 그림 1.4의 중간 세로 줄에서 표현된 것처럼 term들이 알파벳 순이 되도록 이런 리스트들을 정렬하는 것이다. 똑같은 문서에서 동일한 term이 중복 발생이 되는 것은 합병되어질 수 있다. 그림 1.4의 오른쪽 세로줄에서 보여주듯이, 동일한 term이 그룹화되어지는 대신 그 결과는 dictionary와 posting으로 나뉘어진다. 일반적으로 term은 수 많은 문서에서 발생하기 때문에 이러한 데이터 구조화는 색인이 요구하는 저장공간을 감소시킨다. 또한 dictionary는 각 term을 포함하는 문서의 개수(각 posting list의 길이인 document frequency)와 같은 몇몇 통계를 기록한다. 이러한 정보는 기본적인 Boolean 검색 엔진에서는 그리 중요하지 않지만, 질의시 검색엔진의 성능을 향상시키며, 많은 랭킹 검색 모델(Ranked Retrieval Model)에서 향후 사용되어지는 통계이다.
Posting은 2차적으로 docID에 의해 정렬되어진다. 이것은 효과적인 질의 처리를 위해 기본이다. 이러한 역색인 구조는 본질적으로 Ad-hoc 텍스트 검색을 지원하는 가장 효과적인 구조체로서 경쟁 대상이 없다.
 색인 결과를 저장하기 위해서 2개의 dictionary와 posting list를 위한 저장 공간이 필요하다. 후자는 더 크지만, dictionary는 일반적으로 메모리상에서 관리를 하고, posting list들은 디스크상에서 관리를 한다. 그래서 각각의 크기는 중요하다. Chapter 5에서, 우리는 저장공간을 어떻게 잘 활용할 것이며 효과적으로 어떻게 접근할 것인지에 대해 시험한다. 어떤 데이터 구조체를 posting list를 위해 사용할 것인가? 고정된 길이의 배열은 낭비다. 몇몇 단어들은 많은 문서에서 발생하고, 어떤 단어들은 매우 적게 출현한다. 메모리상의 posting list를 위해서 singly linekd lists와 가변 길이 배열(variable length array)가 2가지 좋은 선택이다. singly linked list는 posting list에 문서 삽입 비용을 효과적으로 한다. (웹 문서를 재수집시 업데이트된 문서를 업데이트) 자연스럽게 추가적인 포인터를 요구하는 리스트를 건너 띔으로써 좀 더 향상된 색인 전략으로 확대할 수 있다.

 가변 길이 배열은 포인터와 요청에 대한 오버헤드를 피할 수 있어 공간 요구에 대해 효과적이다. 왜냐하면, 그들의 인접한 메모리를 사용하는 것은 메모리 캐쉬로 인해 최근 프로세서는 속도를 향상시킬 수 있다. 여분의 포인터는 실제로 옵셋처럼 리스트들로 인코딩되어질 수 있다. 만일, 업데이트가 상대적으로 드물다면 가변 길이 배열은 찾기에 더 간결하고 빨라진다. 또한 우리는 각 term에 대해 고정 길이 배열의 리스트를 연결하는 혼합 체계를 사용할 수 있다. Posting list들이 디스크상에 저장되었을 때 그것들은 그림 1.3과 같이 포인터없이 인접하게끔 (아마 압축 형태로) 저장되어진다. 그렇게 함으로써, posting list의 사이즈를 줄일 수 있고 메모리 상에서 posting list들을 읽기 위해 찾을 수 있다.

Exercise 1.1 다음 문서 컬렉션을 위해 구축되어질 역색인을 그려라. (예제로 그림 1.3을 보라)
          Doc 1   new home sales top forecats
          Doc 2   home sales rise in july
          Doc 3   increase in home sales in july
          Doc 4   july new home sales rise

Exercise 1.2 이러한 문서들을 가정하자.
          Doc 1   breakthrough drug for schizophrenia
          Doc 2   new schizophrenia drug
          Doc 3   new approach for treatment of schizophrenia
          Doc 4   new hopes for schizophrenia patients

                a. 문서 컬렉션을 위해 term-document 접속행렬(incidence matrix)를 그려라.
                b. 6 페이지의 그림 1.3과 같이 이 컬렉션을 위해 역색인 표현을 하라.

Exercise 1.3  Exercise 1.2에서 보여준 문서 컬렉션에서 다음과 같은 질의어에 대한 결과는 무엇인가?
          a. schizophrenia AND drug
          b. for AND NOT (drug OR approach)

** 이전 글 **
Introduction
1.1 An example information retrieval problem

** 다음 글 **
1.3 Processing Boolean queries
1.4 The extended Boolean model versus ranked retrieval
1.5 References and further reading
블로그 이미지

쩐의시대

나답게 살아가고 나답게 살아가자

,