Computer Science

튜링 테스트

AI는 지능이 있는가

여러분은 AI에게 지능이 있다고 생각하는가? 놀라운 점은 이 질문은 70년이 넘게 지난 1950년에도 논의된 문제라는 것이다. 그리고 이 질문 가운데에는 튜링테스트가 있다.

튜링 테스트란

천재 컴퓨터과학자 앨런 튜링은 '지능이 있는 인간과 기계를 두고 둘이 내놓는 결과를 구분할 수 없다면 기계 또한 지능이 있다고 볼 수 있다'는 것을 주장하고 싶었다. 이를 위해 고안한 게임이 튜링 테스트이다. 튜링 테스트는 다음과 같이 진행된다.

판별자의 역할을 맡은 사람이 두 대상과 채팅을 한다. 단, 이 둘 중 하나는 기계이다. 판별자는 하나가 기계라는 사실은 알지만 어떤 것이 기계인지는 모른다.
판별자가 채팅을 마치면 더 사람 같은 대상을 고른다.
만약 이 투표에 유의미한 결과가 나오지 않는다면 기계는 튜링 테스트를 통과한 것이고 그 뜻은 즉 지능이 있는 것이다.

튜링 테스트의 9가지 반박과 재반박

물론 당연하지만 모든 사람이 튜링 테스트에 동의할 수는 없는 것이다. 그리고 튜링 테스트에 대해서는 유명한 반박이 9가지가 있다.

신학적 반론 (The Theological Objection)

생각은 인간의 불멸의 영혼에 속한 기능이며, 신은 오직 인간에게만 영혼을 주셨기에 기계는 생각할 수 없다.

이에 대해 튜링은 이 반박은 신의 능력을 제한하는 오만한 생각이라고 반론했다. 신이 인간에게만 영혼을 부여했다는 근거도 없고 보장도 없다. 신이 원한다면 기계에도 영혼을 부여할 수 있다.

현실 도피성 반론 (The ‘Heads in the Sand’ Objection)

기계가 생각한다는 결과는 너무 끔찍하다. 인간이 기계보다 우월해야만 하므로 그런 일은 일어나지 않기를 바란다.

이에 대해 튜링은 반박할 가치조차 없다고 말했다. 이는 논리적 근거가 없는 감정적인 두려움일 뿐이다.

수학적 반론 (The Mathematical Objection)

괴델의 불완전성 정리 등에 따르면, 논리 체계 안에는 ‘참이지만 증명할 수 없는 문장’이 존재한다. 기계는 논리적 한계에 부딪히지만 인간은 이를 직관으로 넘설 수 있다.

튜링은 기계에게 한계가 있다는 것은 인정하였다. 하지만 인간 역시 오류가 없거나 한계가 없다는 증거는 없기 때문에 이는 타당한 반박이 될 수 없다고 주장하였다.

의식에 기초한 반론 (The Argument from Consciousness)

기계는 감정을 느끼거나 예술적 희열을 경험하지 못한다. 즉, ‘자각’이 없다면 진정한 지능이 아니다.

이는 ‘타자의 마음’ 문제로 이어진다. 타자의 마음 문제는 자신이 오직 자신의 마음만을 직접 경험할 수 있을 뿐, 타인도 자신과 같은 의식과 감정을 가진 존재인지 입증할 수 없다는 철학적 난제이다. 내가 다른 사람의 의식을 직접 확인하지 못해도 소통을 통해 지능을 인정하듯, 기계와 완벽한 대화가 가능하다면 의식이 없다고 단정할 근거가 없다.

다양한 능력의 결여에 기초한 반론 (Arguments from Various Disabilities)

기계가 다른건 몰라도 유머를 느끼거나 사랑에 빠지거나 음식을 즐기지 못한다.

이는 과거의 성능이 낮은 기계만 보고 판단하는 귀납적 일반화의 오류이다. 기계가 그런 행동을 수행하지 못할 논리적인 근거와 이유는 어디에도 없다.

러브레이스 부인의 반론 (Lady Lovelace’s Objection)

기계는 시키는 대로만 할 뿐 스스로 무언가를 창조하거나 우리를 놀라게 할 수 없다.

이에 대한 재반박을 하기 전에, 러브레이스 부인에 대한 이야기를 하겠다. 러브레이스 부인은 에이다 러브레이스를 말하는 것으로 최초의 프로그래머로 잘 알려져 있는 사람이다. 애초에 러브레이스는 19세기 사람이고 튜링은 20세기 사람인데다 둘은 아예 생존 기간?이 겹치지 않기 때문에 당연히 러브레이스가 이 튜링 테스트에 직접 반박을 한 것은 아니다. 이 반박은 러브레이스가 1843년에 노트해둔 문구를 그대로 인용해온 반박이다.

기계도 학습을 통해 예상치 못한 결과를 내놓을 수 있으며, 인간의 독창성 역시 기존 지식의 재조합인 경우가 많다. 이에 대해 튜링은 “기계는 나를 자주 놀라게 한다.”라고 말하며 재반박했다.

여기에 조금 더 추가를 하자면, 지금 우리가 사는 세계는 Gemini, ChatGPT, Claude 등 많은 생성형 AI가 존재한다. 그리고 이 생성형 AI는 쉽게 무언가를 창조해낸다. Gemini의 Nanobanana는 프롬프트만 입력하면 바로바로 그림을 창조해내고 필자가 가끔 이용하는 Suno AI는 프롬프트를 굳이 넣지 않아도 스스로 노래를 만들어낸다.

신경계의 연속성에 기초한 반론 (Argument from Continuity in the Nervous System)

인간의 뇌는 연속적인 아날로그 체계이지만, 컴퓨터는 0과 1의 이산적인 디지털 체계이므로 뇌를 완벽히 흉내 낼 수 없다.

튜링 테스트는 내부 구조가 아니라 출력을 보는 게임이다. 그렇기 때문에 튜링 테스트의 반박으로 신경계의 연속성과 컴퓨터의 이산성을 거론하는 것은 적절하지 않다. 또한, 이산 상태 기계도 충분히 정밀하다면 질문자가 구분하지 못할 정도로 아날로그 체계를 모방할 수 있다.

행동의 비정형성에 기초한 반론 (The Argument from Informality of Behavior)

인간은 상황에 따라 유연하게 대처하지만, 기계는 정해진 규칙에 의해서만 움직이므로 모든 상황에 대응하는 복잡한 규칙을 만드는 것은 불가능하다.

인간의 행동 역시 우리가 아직 발견하지 못한 복잡한 자연 법칙에 지배받고 있을 뿐일 수 있다. 규칙이 보이지 않는다고 해서 규칙이 없는 것은 아니다.

여담으로, 이를 주장하는 것이 힐러리 퍼트남의 인간 마음의 컴퓨터 모델이다. 이 모델에 따르면 우리는 그저 프로그래밍 된 존재일 뿐이며 정해진 규칙과 알고리즘에 따라서만 움직인다.

ESP에 기초한 반론 (The Argument from Extra-Sensory Perception)

만약 텔레파시나 투시 같은 ESP가 존재한다면, 질문자가 이를 이용해 기계와 인간을 구분해낼 수 있다.

그 전에 ESP에 대해서 설명을 보태자면, Extra-Sensory-Perception, 즉 초감각적 지각의 줄임말로, 흔히 말하는 텔레파시, 예지력, 투시력 등을 말한다.

튜링은 이에 대해 ESP의 가능성은 존재하나, 그럴 경우 테스트 환경에 ESP 차단 장치를 설치하면 해결된다고 넘겼다. 그리고 사실 애초에 이 반박은 튜링 테스트의 본질을 파고 들지 못한다. 실제로 튜링 테스트가 진행될 경우에 대해서는 반박할 수 있겠지만, 튜링 테스트의 본질은 이를 토대로 기계의 지능 유무를 판단 하는 것이기 때문에 적절한 반박이 될 수 없다.

논리적 평가

이제 여기서 질문이 생길 수 있다. 튜링 테스트는 기계에게 지능이 있는지를 판별하는 필요조건인가, 충분조건인가? 이는 철학자 사이에서도 갈린다.

필요조건이다

앨런 튜링 조차 필요조건이라고 하지 않은 만큼 반박이 매우 쉽다. 고도로 지능적이지만 인간 언어를 모르는 외계인 또는 동물이 있다면 그들은 지능이 있음에도 불구하고 튜링 테스트를 통과할 수 없을 것이다. 그렇기 때문에 튜링 테스트의 통과가 지능의 필요조건이 될 수 없다.

충분조건이다.

이는 필요조건만큼 반박이 쉽지는 않지만 네드 블록의 블록헤드와 존 설의 중국어 방으로 반박될 수 있다.

결론

필자가 생각하기에도 튜링 테스트는 완벽하진 않다. 그럼에도 불구하고 튜링 테스트는 지능을 판별하기 위한 시도로 의의가 있으며 추후 지능을 판별하는 바람직한 기준에 수렴하는데에 도움을 줄 것이다.

튜링 테스트

튜링 테스트란