닫기
Loading..

전자정보연구정보센터 ICT 융합 전문연구정보의 집대성

라이징스타

홈 홈 > 포커스iN > 라이징스타

국내외의 전자정보 분야의 우수 연구자를 선별하여 소개합니다.
연구자의 연구 경험담 및 관련 분야 동향까지 연구활동에 대한 전반적인 내용을 인터뷰하여 정리하였습니다.

  • 이종욱
  • 성균관대학교 소프트웨어학과
  • jongwuklee@skku.edu

트위터 공유

페이스북 공유


▶ 간략한 소개 부탁드립니다. 


성균관대학교 소프트웨어학과 부교수로 재직 중인 이종욱입니다. 저는 2012년도에 포항공과대학교에서 컴퓨터공학 박사학위를 받고, 펜실베니아 주립대학교에서 박사후연구원으로 2년 정도 있었습니다. 이후에는 한국외국어대학교 컴퓨터공학과에서 조교수로 2년 정도 재직하다가 2016년부터 성균관대학교 소프트웨어학과로 옮겨 부교수로 재직 중에 있습니다.



▶ 주요 연구 분야에 대한 소개 부탁드립니다.


제가 주로 연구하고 있는 분야는 추천검색입니다. 추천과 검색은 개인화 기술과 밀접하게 관련이 있는데요. 수많은 데이터 중에서 사용자가 원하는 소량의 정보를 효과적으로 찾을 수 있도록 하는 기반 기술이라고 볼 수 있습니다. 검색은 흔히 말하는 웹 검색엔진을 떠올리면 됩니다. 사용자가 어떤 키워드 형태로 질의를 입력했을 때 그 질의에 맞는 문서를 찾아내는 것이 검색의 목적이라고 할 수 있습니다. 예를 들면 '성균관대 맛집'을 검색했을 때, 이 키워드와 관련된 수많은 문서 중에서 소량의 적합 문서를 순위화하여 효과적으로 제공할 수 있어야 합니다. 


추천의 경우는 사용자가 본인이 무엇을 원하는지를 명시적으로 표시하지 않습니다. 가령 내가 어떤 맛집을 찾는다고 했을 때 어떤 특정한 맛집을 찾겠다는 것을 명시적으로 지정하지 않고 '나는 그냥 맛집을 찾고 싶은데 알아서 찾아달라'는 암시적 요구를 하면 추천 시스템은 사용자의 과거 로그들을 활용해서 사용자의 취향을 판단하고, 그 취향에 맞게 주어진 문맥 안에서 의미 있는 소량의 정보를 제공하는 것을 목적으로 합니다. 이처럼 추천시스템은 사용자가 무엇을 원하는지를 구체적으로 표시하지 않기 때문에 검색보다는 어려운 문제일 수 있습니다. 하지만 사용자 본인이 정확히 무엇을 원하는지 모르는 경우도 꽤 많아서 추천 결과가 사용자에게 100% 만족을 주지 못하더라도 어느 정도의 만족도를 높여 주기만 하면 마치 시스템이 나를 알아주는 친구처럼 친밀감도 느낄 수 있고, 특히 추천 결과가 생각보다 유의미하면 시스템에 대한 만족도가 크게 상승할 수 있는 이점이 있습니다. 이와 같은 특성으로 최근에는 추천시스템에 대한 연구도 많이 진보하고 있고, 특히 산업계에서 활발하게 활용이 되고 있습니다.


이 외에도 저희 연구실에서 진행하는 연구들이 몇 가지 더 있습니다. 대표적으로 자연어처리 관련해서도 연구를 진행하고 있습니다. 사실 자연어처리는 검색 기술과 관련이 매우 높습니다. 기본적으로 다루고자 하는 데이터가 문서 데이터이다 보니 자연어에 대한 이해가 반드시 필요할 수밖에 없고 그러다 보니 저희 연구실에서도 자연스럽게 자연어처리에 대한 연구를 진행하게 되었습니다. 저희 연구실에서 진행하는 자연어처리 연구는 대표적으로 ‘자연어 형태의 수학 문제 풀이’가 있습니다. 예를 들어 ‘철이와 영희가 각각 과자 3개 과일 5개를 갖고 있을 때 과자와 과일의 합을 묻는 문제’를 단순히 3+5로 덧셈풀이를 하는 것이 아니라 문장의 의미를 이해하고 이를 수식으로 표현해서 풀어내는 방식입니다. 이처럼 자연어 형태의 수학 문제를 컴퓨터가 잘 이해하고 수식 형태로 변환하는 문제를 자연어 수학 문제풀이라고 하며, 이와 관련해서 저희 연구팀이 작년에 정보통신기획평가원 주관의 인공지능 그랜드 챌린지에 출전을 하였고, 운 좋게도 우수한 성과를 얻었으며, 이 대회를 계기로 현재 관련 연구를 중점적으로 진행하고 있습니다. 또 다른 연구 주제는 은유 탐지 연구입니다. 언어학자들에 따르면 사람들은 언어를 사용할 때 독특한 특성을 가지고 있다고 합니다. 대표적으로 은유적인 표현, 반어적인 표현 또는 모순적인 표현을 들 수 있는데요. 예를 들어 '발레리나가 백조처럼 춤을 춘다' '토론이 날카로워졌다' 같은 문장을 과연 컴퓨터가 이해하고 이 문장이 은유적인 표현인지 아닌지를 탐지할 수 있는지에 대한 연구입니다.


마지막으로 다루고 있는 연구 주제는 기계학습입니다. 앞에서도 말씀드린 검색 추천이나 자연어처리 연구를 하다 보니 자연스레 기계학습 또는 딥러닝에 대한 근본적인 이해가 필요하다는 생각이 들었습니다. 그래서 이와 관련해서도 연구를 진행하고 있습니다. 대표적으로 보통 지도학습을 하게 되면 레이블이 주어진 데이터를 가지고 학습을 하는데, 그 레이블을 항상 정답으로 생각하고 학습을 합니다. 하지만 그 레이블조차도 정답이 아닌 경우가 꽤 존재할 수 있습니다. 예를 들면 어떤 주어진 영상이 치타 그림이라고 했을 때 사실 전문가가 아닌 이상 이것이 치타인지 표범인지를 정확하게 구분해내는 게 힘든데 제 영상 분류 문제에서는 치타와 표본을 정확하게 분류하는 것을 요구합니다. 그러다 보니 사람들이 제공하는 레이블의 활용이 필요하며, 그 레이블이 틀리게 제공되는 경우가 꽤 있을 수 있습니다. 그러한 레이블에 어떠한 노이즈가 일부 존재하고 있는 상황에서도 기계학습 모델이 효과적으로 학습을 잘 할 수 있을지에 대한 연구를 진행하고 있습니다. 또한 검색과 추천을 분류 분류로 정의할 경우, 매우 많은 클래스를 가진 분류 분류로 볼 수 있습니다. 이와 같은 극단적인 수의 클래스를 가진 분류 문제에 대해서도 관심을 가지고 성능을 개선하는 방법에 대해서 연구를 진행하고 있습니다. 이와 같은 연구 주제는 검색과 추천에서 다루는 데이터에 흔하게 발생하는 이슈이다 보니 검색과 추천의 정확도 향상을 위해서도 관련이 높다고 생각합니다.


 

▶ '젊은정보과학자상(KIISE/IEEE-CS Young Computer Researcher Award)'을 수상하신 소감을 말씀해 주세요.


이 분야에서 저보다 훌륭하신 분들이 정말 많은데 제가 이 영예로운 상을 받게 되어 매우 기쁘면서도, 한편으로는 마음의 부담이 느껴지며, 좀 더 열심히 연구를 해야겠다는 다짐도 하게 됩니다. 또한 이 상은 저희 연구실 학생들과 함께 일궈낸 연구적인 성과들이 좋은 평가를 받은 것으로 저와 학생들의 공동의 성과라고 생각합니다.


우수성과 >>



▶ 이 분야를 선택하신 계기가 있다면 말씀해 주세요. 


대학원 시절 데이터베이스 연구실에서 처음 연구를 시작했는데, 당시 제 지도교수님께서는 데이터베이스시스템과 관련된 연구보다는 애플리케이션에 좀 더 가까운 연구를 진행하셨습니다. 그때 진행하신 연구가 순위화 문제입니다. 보통 '순위화 질의' 라고 말하는데, 사용자의 선호도가 주어졌을 때 그 선호도에 맞는 결과물들을 순위화하여 효율적으로 제공하는 질의에 대한 연구였습니다. 그러다 보니 저도 자연스럽게 지도 교수님을 따라 이 연구에 관심을 갖게 되었고, 그러던 중에 DB뿐만 아니라 정보 검색의 연구에도 관심을 가지게 되었고, 향후에는 추천 시스템에도 관심을 기울이게 되었습니다. 그리고 근래에 와서는 심층신경망 기반의 모델들을 이용하여 정보 검색이나 추천 시스템의 문제를 해결하다 보니, 개인화를 어떻게 연구하는지에 대한 방법론이 데이터베이스의 전통적인 방법론에서 이제는 기계학습 쪽으로 이동을 하게 되었습니다.



▶ 친구추천, 유튜브, 상품추천, OTT 플랫폼 등 추천시스템의 영역은 지속적으로 확대되고 있어 중요성도 높아지고 있다고 생각합니다. 추천시스템 구현을 위한 알고리즘 개발에 있어 가장 중요한 부분은 무엇이라고 생각하십니까?


가장 대표적으로 유튜브를 들 수 있을 것입니다. 물론 추천기술이 항상 아주 좋다고는 할 수 없겠지만 서비스 측면에서 어느 정도는 사용자들의 만족도를 꽤 높이는 데 많이 활용이 되고 있고 실제로 이커머스 상에서는 매출 증대에도 꽤 도움이 되는 걸로 알고 있습니다. 이러한 추천시스템 구현에서 저는 우선 1차적으로 정확도를 높이는 데 관심이 있으며, 그 외에도 추천시스템에서 가장 우려하는 ‘정보 편향’, 즉 ‘확증 편향’과 같은 문제, 그리고 ‘개인정보 보호’에 대한 이슈 등 추천과 관련해서 발생할 수 있는 문제점 해결을 위한 연구에도 관심이 많습니다. 기본적으로 추천시스템은 사용자의 데이터를 수집해야만 가능하며, 사용자가 과거에 검색한 로그 정보, 즉 나의 사용기록과 사용자와 비슷한 취향의 다른 사람들이 본 것들을 모아서 제공해 주는 것이 기본적인 형태입니다. 따라서 이러한 저장 기록을 바탕으로 사용자가 보고 싶은 정보만 보게 하는 편향적인 추천 결과를 제공하게 되고 또한 과거 정보에 대한 기록 저장을 많이 해야 성능이 점점 좋아지는 특성을 갖고 있기 때문에 그만큼 개인정보 보호에 대한 이슈도 발생할 수가 있습니다. 따라서 저는 정확도 개선도 중요하게 여기지만, 이와 더불어 이러한 정보 편향을 좀 더 완화하면서 추천 결과를 제공하는 연구에 관심이 있고, 이와 함께 개인정보도 보호하며 안전하게 추천의 결과를 제공할 수 있는 연구도 진행하려고 합니다.



▶ 앞으로 연구방향이나 시도하고 싶은 연구가 있다면?


위에서 언급한 개인정보 보호를 고려한 추천시스템 연구에 가장 관심이 많습니다. 보통 로그 정보가 중앙 서버에 다 저장이 되는데 그런 형태가 아닌 중앙 서버에 저장이 안 되더라도 어떻게 추천을 잘할 수 있을지, 내 정보가 나의 어떤 동의 없이 유출되지 않으면서 어떻게 추천의 정확도를 잘 유지할지 등과 같은 개선도를 높이는 연구를 좀 더 진행해 보려고 합니다. 


다른 방향으로는 학습 방법의 개선입니다. 추천 결과를 제공하려면 기계학습 모델을 계속 학습하게 되는데 학습과정에서 데이터가 축적될 때마다 처음부터 다시 학습을 하는데 그러다 보니 아무래도 컴퓨팅 리소스 부분에 있어서 데이터가 많으면 많을수록 오버헤드가 점점 커지기 때문에 그런 식의 오버헤드를 잘 줄이면서 어떻게 해야 추가된 데이터에 대해서만 효과적으로 학습을 할 것인지 소위 연속학습(continual learning)이라고 불리는 방법을 추천 모델에 어떻게 적용할 지에도 관심이 있습니다. 


또 다른 하나는 추천 모델의 설명 가능성 측면입니다. 사용자가 추천 결과를 제공받았을 때 왜 이것이 추천되었는지 이해할 수 있어야 합니다. 물론 사용자가 직관적으로 ‘나의 취향을 잘 반영한 것 같다’라고 인지하기도 하지만 때로는 추천 결과에 대해 전혀 이해하지 못하는 경우도 종종 있을 수 있습니다. 이때 왜 추천이 되었는지를 잘 설명할 수 있다면 추천시스템에 대한 신뢰도나 또는 어떤 두려움이 조금은 완화될 수 있지 않을까라고 생각합니다. 그래서 설명 가능한 추천 관련해서도 연구를 하고 싶습니다.


마지막으로, 이와 함께 현재 진행하고 있는 검색 모델의 성능을 높이기 위한 연구를 좀 더 추진해 나갈 생각입니다. 대표적으로 사전 학습된 언어 모델을 효과적이고 효율적으로 활용하여 기존의 검색 모델의 정확도와 효율성을 높이는 연구를 좀 더 활발히 진행하고 싶습니다.



▶ 교수님에게 영향을 미친 인물 또는 귀감으로 삼으시는 연구자가 있다면?


제일 먼저 떠오르는 분은 제 지도 교수님이신, 당시에는 POSTECH에 계셨지만 지금은 서울대에 계신 황승원 교수님입니다. 저는 사실 처음 대학원에 진학할 때는 박사를 하고 교수가 될 생각은 없었습니다. 그때는 단지 어린 마음에 '공부를 더 하면 전문가가 되지 않을까'라는 막연한 생각으로 대학원에 진학을 했고, 지도 교수님이신 황승원 교수님을 만나 연구라는 게 어떤 것인지 새삼 알게 되었습니다. 그 당시만 해도 석사과정생들은 연구를 하기가 수월하지 않았던 것 같은데, 저는 운 좋게도 석사과정부터 논문도 많이 읽고 직접 참여해서 논문을 써본 경험을 하면서 자연스레 연구에 더 관심을 가지게 되었습니다. 덕분에 박사과정까지 하고 현재는 교수까지 하게 됐다고 생각합니다.


당시 지도 교수님께서는 저에게 "연구라는 게 그다지 어려운 게 아니다. 남들이 생각하지 못한 것을 시도해보고 그것이 정말 처음 하는 것이라면 거기에 의미를 부여하면 되는 것이고, 처음이 아니라면 이제 석사과정 학생인데 그런 비슷한 생각을 했다는 것만으로도 대단한 거다"라고 지속적으로 용기를 북돋아 주셨습니다. 그 덕분에 도전적으로 연구를 해볼 수 있었고 교수님의 그러한 지도가 저에게 큰 영향을 끼쳤다고 생각합니다.


그 외에도 저에게 영향을 주신 분들이 많습니다. 펜실베니아 주립대학교에서 박사후연구원으로 있을 때 저의 슈퍼바이저였던 이동원 교수님께서 연구에 많은 영감을 주셨고, 현재 성균관대학교의 이상원 교수님은 학생을 협력자로서 동료로서 어떻게 대해야 하는지에 많은 깨달음을 주십니다. 최근에는 여러 교수님들과도 공동 연구를 진행하였는데, 한양대학교 김상욱 교수님, 연세대학교 심현정 교수님과 서울대학교 이준석 교수님과 함께 연구하면서 제가 미처 생각도 못한 것들을 다양한 관점에서 바라보는 방법에 대해서 많이 배우게 되었습니다. 이러한 분들이 제 연구에 대한 귀감이 되시는 분들이라고 말씀드리고 싶습니다.



▶ 수업이나 학생 지도방식 등에 있어서 교수로서의 포부가 있다면?


학부생들의 경우 교류할 수 있는 기회가 수업시간인 것 같은데, 학생 수가 많다 보니 그다지 쉽지만은 않습니다. 그래도 가능한 한 이름을 모두 외우려고 노력하고, 질문도 많이 받는 등 소통할 수 있는 기회를 많이 갖고자 합니다. 대학원생들의 경우는 어떻게 보면 지도 교수와 지도 학생이 딱딱한 관계라고 볼 수도 있지만, 또 다른 관점에서 보면 연구를 하는 데 있어서 가장 가까운 협력자라고 말할 수 있습니다. 서로에게 있어서 부족한 부분을 채울 수 있는 협력관계로 생각했을 때, ‘소통’이 정말 중요하다고 생각합니다. 학생들이 어떤 새로운 아이디어를 생각해내는 경우도 많기 때문에, 그러한 부분들을 제가 이해하려면 많은 대화와 소통이 필요하다고 생각합니다. 이와 같은 소통을 위해서 저는 최대한 많은 시간을 가지려고 노력하고 있습니다.



▶ 특별히 기억에 남는 자신의 논문을 꼽는다면?


제 첫 논문과 박사과정 시절 VLDB (International Conference on Very Large Data Bases)에 발표된 논문*이 제일 기억에 남습니다. VLDB는 데이터베이스 분야에서 우수 학회로 꼽히는 국제학술대회인데, 당시 저로서는 연구력이 제일 좋았던 시기가 아니었나 싶습니다. 

* QSkycube: Efficient Skycube Computation using Point-Based Space Partitioning


교수가 된 이후에는 사실 논문보다는, 물론 그동안의 논문들이 다 기억이 나지만, 그보다는 저희 연구실 학생들과 함께 경진대회에 출전한 경험을 말씀드리고 싶습니다. 저희 연구실 초창기였던 2018년도에 RecSys(ACM Conference on Recommender Systems)라는 추천시스템에 특화된 학회에서 열리는 Kaggle 같은 경진대회에 출전한 적이 있습니다. 당시에는 연구실에 대학원생이 많지 않아서 제 수업을 듣는 학생들 중 저희 연구실에 관심 있는 학부생들을 연구 학생으로 지도하고 있었는데, 학생들과 함께 열심히 노력한 덕분에 RecSys 챌린지라는 경진대회에서 2등을 하는 성과를 거뒀습니다. 처음에는 시행착오도 있었지만 열심히 하다 보니 좋은 성과를 얻게 되었고, 결과적으로 저와 참여 학생들 모두에게 좋은 경험이었다고 생각합니다. 그 성과를 계기로 토론토 대학교에 유학을 간 학생도 있었고, 저희 연구실에서 박사과정 학생으로 함께 연구를 함께 하고 있는 학생도 생기게 되었습니다. 저에게는 이 대회가 저희 연구실이나 제게 변곡점이 되었고, 무엇보다도 열심히 하면 충분히 할 수 있다는 것을 보여준 사례였기에 아주 큰 의미가 있다고 생각합니다.



▶ 도움이 될 만한 분야 관련 사이트 또는 서적 추천을 부탁드립니다.


검색이나 추천 관련해서는 당연히 전공 서적들을 찾아보시면 될 것 같습니다. 요즘은 자료 공개된 것들이 많아서 인터넷상에서 충분히 찾을 수 있을 것으로 생각합니다. 최근에는 추천시스템 관련한 커뮤니티가 있습니다. 그 사이트를 보면 추천 관련된 여러 정보들을 모아 놓고 제공하고 있기 때문에 아마도 많은 도움이 될 것 같습니다. 


서적 중에서는 『마스터 알고리즘』을 추천하고 싶습니다. 현재 워싱턴대학교 교수님으로, 데이터마이닝 분야의 최고 학회 KDD에서 2년 연속 수상하신 머신러닝 전문가가 집필한 책입니다. 보통 머신러닝 하면 딥러닝만 떠올리는데 사실은 머신러닝 분야 자체가 1950년대부터 연구가 시작되었고, 계속 진행되면서 다양한 기법들이 시도가 되었습니다. 이 책에서는 이러한 기법들의 장단점과 궁극적으로는 이러한 것들을 모두 통합해야 기계학습 알고리즘, 즉 마스터 알고리즘을 만들어낼 수 있다는 내용을 담고 있습니다. 여기서 저자는 마치 게임처럼 머신러닝의 다섯 종족을 언급하면서 각각의 방법론을 설명하고 있습니다. 딱히 수학을 잘 알지 못해도 충분히 이해할 수 있을 것으로 생각되므로 이 책을 한번 읽어보시기를 추천합니다.



▶ 이 분야로 진출하려는 후배들에게 필요한 지식과 자세에 대한 조언 부탁드립니다.


물론 전공 공부를 열심히 해야 하겠지만, 컴퓨터의 가장 핵심이 되는 부분은 프로그래밍인 것 같습니다. 기계학습이든 컴퓨터와 관련된 다른 분야이든 우선은 프로그래밍이 가장 기초가 되어야 할 것 같습니다. 요즘은 프로그래밍을 해보고 테스트할 수 있는 사이트들이 많이 있습니다. 기회가 된다면 이러한 사이트를 이용해서 많은 시도를 많이 해보는 게 좋지 않을까 생각합니다.


두 번째로는, 컴퓨터과학이라는 학문이 다른 학문 대비 가장 차별성에 있는 부분이 ‘사람의 독창성’이라고 생각합니다. 사실 이 분야는 어떤 사업을 계획하는, 즉 흔히 말하는 스타트업을 하는 데 있어서, 상대적으로 아주 많은 자본이 들지는 않습니다. 제가 대학원 초창기 때 지도 교수님께 이런 말을 들은 적이 있습니다. “제조업 같은 경우에는 여러 장비도 사야 하기 때문에 초기 투자비용이 꽤 많이 들 수 있는데 컴퓨터공학 같은 경우에는 소위 랩톱 한 대만 있으면 카페나 내가 앉을 수 있는 공간 하나만 있으면 머릿속에 수많은 생각과 영감을 통해 새로운 가상 공간을 쉽게 만들어낼 수 있다.” 이 말씀이 저는 아직도 기억이 납니다. 이처럼 컴퓨터를 공부하는 친구들에게 ‘내가 정말 세상을 바꿀 수 있다. 세상을 뒤집을 수 있다’라는 자신감과 도전감 그리고 열정을 가장 강조하고 싶습니다.



▶ 앞으로 계획이 있다면 말씀해 주세요. 


저는 실제적으로 사람들에게 도움이 될 수 있는 기술을 개발했으면 좋겠다는 생각을 합니다. 그래서 저는 기회가 된다면 앞에서도 설명 드린 검색 관련해서 기업 쪽과도 협업을 하여 저희가 만든 새로운 모델이 검색의 성능을 높이는 데 실질적으로 활용이 될 수 있기를 바랍니다. 


조금 다른 시선일 수 있지만 교육과 관련해서 검색과 추천 연구를 진행해보고 싶습니다. 코로나로 인해 학생들 간의 교육 격차가 점점 커지고 있다고 합니다. 사실 코로나19 시기로 교육 환경이 갑작스럽게 온라인으로 바꿨는데, 온라인에서도 학생들이 잘 공부할 수 있게끔 도와주는 서비스들이 충분히 개발되지 않아서 그러한 문제가 발생한다고 생각합니다. 이러한 문제를 해결하는 데 도움을 줄 수 있는, 가령 학생이 문제를 푸는 데 있어서 ‘이런 문제를 풀면 실력이 더 빨리 늘 수 있다’ 같은 문제 추천 모델을 만들어보고 싶습니다.



▶ 그 밖에 하시고 싶은 이야기


현재 저는 소프트웨어학과와 인공지능학과에 속해 있습니다. 요즘은 정말 많은 대학에 인공지능학과가 생기고 있는데, 저희 성균관대학교 인공지능학과에도 학생들이 많은 관심을 기울여 주고 많이 지원했으면 합니다. 저희 학교의 인공지능학과에 대해 차별성만 간단하게 말씀드리면 다른 대학보다도 산업체와의 협력과 산업 중심의 인재를 육성하는 데 있어서 이지형 학과장님이 정말 많은 관심을 가지고 이끌어 나가고 있다고 생각합니다. 연구도 당연히 중요하지만, 그 연구 내용이 실제 산업체에 활용 측면에서도 충분히 잘 될 수 있는 커리큘럼을 저희 대학의 인공지능학과에서 갖추고 있다고 생각하며, 관심 있는 분들이 많이 연락을 해 주시면 좋겠습니다. 더불어 저희 연구실에도 관심 있으신 분들은 제게 연락 주시면 성심껏 답변 드리도록 하겠습니다. 감사합니다.


연구자 정보 >>

2022년 4월