중견 국문학자와 언어학자의 7년에 걸친 공동 노력으로 품사별 한국어 어휘 사용 지도가 처음 완성됐다. 고려대 김흥규(김흥규·국문과) 강범모(강범모·언어과학과) 교수의 한국어 어휘 사용 빈도 통계작업은 첨단 컴퓨터의 힘과 언어학 석·박사 60여명의 헌신적인 협력이 이룩한 개가였다. 한 국가의 어휘를 분석하는 데 150만 어절(띄어쓰기의 단위)이나 되는 방대한 자료를 전산처리한 것은 세계적으로도 드문 일이다.

“60년대 미국 브라운대학에서 100만 어절을 전산처리해 어휘관련 자료를 구축한 것이 영어연구사의 획기적인 업적으로 꼽히고 있습니다. 저희들 작업을 기초로 어휘 관련 분야는 물론, 국어정보화와 문장연구 국어교육 분야 등이 한층 발전하길 기대합니다”(강범모 교수).

두 교수의 연구에 의해 한국인들이 가장 즐겨 사용하는 고유명사는 ‘한국’이며 뒤이어 ‘서울’ ‘일본’ ‘미국’ ‘성씨 김(김)’ ‘중국’ ‘북한’ ‘고려’ ‘조선’ ‘신라’ 등의 순인 것으로 밝혀졌다. 감탄사의 경우는 ‘참’ ‘그래’ ‘아니’ ‘글쎄’ ‘아이구’ 등이 선두 그룹을 형성하는 가운데, ‘어머’ ‘제기랄’ ‘아따’ 등이 30위권 안에 들었다.

일반 명사에서는 ‘사회’ ‘나라’ ‘정부’ ‘세계’ ‘시대’ ‘국가’ 등이 사용빈도 30위 안에 들고 있다. 또 ‘국민’ ‘정치’ ‘지역’ 등도 50위권 안에 들며 강세를 보여 현대 한국인들이 어떤 생각을 하며 사는지 엿보게 한다. 일반명사 중에선 ‘문제’가 7위로 상위에 랭크됐는데, 김흥규 교수는 “‘문제’란 용어가 높은 순위를 차지한 것은 현대 한국인이 여러가지 ‘문제’ 속에서 살기 때문 아니겠느냐”고 했다. ‘문화’란 말도 일반 명사 8위에 랭크될 정도로 많이 사용되는 것으로 나타났다.

한편 두 교수의 연구에 의해 어떤 사람이든 사용빈도 상위 1000개의 단어를 아는 것만으로도 한국어의 75%를 이해할 수 있는 것으로 나타났다. 국립국어연구원이 펴낸 표준국어대사전에 실린 단어가 30여만개이니, 한국어 전체 어휘 중 0.3%만 알아도 어느 정도 의사소통이 가능하다는 얘기다.

성씨 사용 횟수도 흥미롭다. 두 교수는 성씨를 고유명사의 범주에 넣어 분석했는데, ‘김’에 이어 ‘이’ ‘박’ ‘최’ ‘정’ ‘노’ ‘홍’의 순으로 집계됐다. 강 교수는 “신문 자료가 차지하는 비중이 20% 정도인 것을 감안하면 시사성 있는 인물의 성씨 분포가 인구별 성씨 분포와 다르다는 추정이 가능하다”고 했다.

/이지형기자 jihyung@chosun.com
저작권자 © 조선일보 동북아연구소 무단전재 및 재배포 금지