AI

[AI 과외 선생] 과연 AI는 수포자를 살릴수 있을까?

seungohjung 2024. 12. 31. 00:42

O3 도 30점 이하만 맞은 전설의 벤치마크 FrontierMath 중 최하 난이도부터 시험해 봤습니다. 

참고로 해당 정답은 3814708984376 입니다. 
3조 8147억 898만 4376이요 ㅋㅋ 


수학과 여러분, 이런게 재밌으세요?

1-1. 질문의 의미 


수포자들의 특인 질문부터 먼저 매우 ㅈ같은 기운이 듭니다. 
제가 풀수 있었던 수학 문제는 단순하게 X =? 였는데, 이번 문제는 X, Y, Z, 심지어 F까지 나옵니다. 

벌써부터 이해가 안 가지만, 아래는 ChatGPT o1 Pro 가 '문제'만 해설한 부분입니다. 

 

 

먼저 문제의 의미를 7살 아이도 이해할 수 있게 해설을 시켰습니다. 

 

즉, 해설을 하자면 x,y,zx, y, z 가 0은 아니지만, x, y, z 가 x³y + y³z + z³x = 0에 공식이 맞지만, F(5^18) 숫자 안에서 나올 수 있는 모든 경우의 수를 찾으라고 하는 거라고 합니다. 단, 같은 비율은 (1,2,3 & 2,4,6 이런 형식의 비율) 같은 거로 본다고 합니다.  

 

단, 여기서 과연 F 는 뭐 하는 걸까요? Fucked Up의 줄임말일까요? 

 

(타이핑에 편하게 위해 F518이라고

 

조금 더 풀어서 이야기를 하면 5 ¹⁸ (3조 8146억 9726만 5625) 숫자 내에서 해당 원소들 사이에서 + - / x를 할 수 있는 구조가 잡혀 있다고 합니다.

그렇다고 모든 숫자를 대입할 수 있는 게 아니라고 합니다. F가 들어가면 F (소수) ^ 숫자 형식으로 된다고 합니다. 

F6 ²는 안되지만, F5 ², 즉 25개 숫자 내에서 확인할 수도 있는 겁니다. 

 

정리를 하자면, 총 3조 8146억9726만 5625 (F518) 숫자 중, x³y + y³z + z³x = 0의 공식에 맞지만, x, y, z는 0 이 아니며, 같은 비율을 제외해서 나올 수 있는 개수가 몇 개가 있을까?라는 이야기입니다. (1,2,3과 2,4,6 은 같은 경우의 수로 정리) 


2-1. 질문의 해설 - 1단계 : 커다란 도넛

대체 얼마나 크게 그려야 하는걸까?

어릴 때 수학 문제를 풀때 대충 1 아니면 0 아니면 -1 이랬는데, 이번 문제는 총 봐야 할 숫자는 3조 8146억 9726만 5625입니다. 살면서 평생 볼 숫자가 아니며, 심지어 같은 비율을 다 계산하기엔 사실상 노가다 하기엔 불가능합니다. 

 

 

먼저 질문을 다시 쉽게 설명을 해봅시다. 뭐 여기까진 이해가 되었는데.. 

 

갑자기 밥 아저씨가 된 GPT 지만 쉽데 참나

 

갑자기 도넛 이야기와 '구멍이 3개 뚫린 도넛'이 나옵니다... 

학창 시절 '구멍 3개 뚫린 도넛으로 외워!' 하는 선생님이 기억이 나는 거처럼 집요하게 한번 파봤습니다. 

 

인터스텔라 재개봉했다고 합니다.

 

먼저 Grapher로 테스트를 해볼 때 사실 실수 (실제의 숫자) 로는 안 보인다!라고 하네요. 시바 꺼. 

 

도넛 구멍이 3개라고 하며, 이걸 비주얼로 보여주려면 4차원 이상의 시바 인터스텔라로 들어가야 한다는 게 혈압이 슬슬 올라가더라고요. 문제가 그래도 해결책이 나오기 시작합니다. 

 

이럴 때 사용하는 공식은 Genus-degree formula라고 합니다. 공식은 g = (d-1)(d-2)/2이며, 여기서 d는 몇 차 방정식에 따라서 달라진다고 합니다. 이게 4차 방정식이다 보니, 3차원에서 봤을 때 도넛이 안보이며, 4차원에서만 보인다고 합니다. 즉, 공식이 만일 5차로 넘어간다면 d에 5를 대입해서 구멍이 6개가 생긴다고 합니다. 

gen(i)us 아닙니다.

왜 굳이, 막 근의 공식이 있는데 어디서 듣지도 못한 Genus-degree formula를 사용한다고 할까요? 그 이유는 공식에 있었습니다. 각 공식이 x³y + y³z + z³x = 0 이 하필이면 차수가 다 같다 보니 사용되는 공식이라고 합니다. 근의 공식은 x, y, z 찾아야 할 결괏값이 하나일 때만 사용하며, genus-degree formula는 변수가 2개 이상이며, 차수가 다 같을 시 사용되는 공식이라고 합니다. (아닐 시 댓글로 수정 부탁드립니다..) 

 

숫자가 너무 커졌다 보니, 그래프를 그려 그 점들을 새는데 필요한 과정이라고 합니다. 

힘들게 구해본 '구멍' 그림

 

즉, 정리를 하자면 x³y + y³z + z³x = 0에 공식은 하필이면 차수가 같으며, 변수가 다 동일하다 보니

genus-degree formula를 사용했을 시 g = (d-1)(d-2)/2 (d = 차수 값) 

g= (4-1)(4-2)/2 

g= 3*2/2 

g= 6/2 

g= 3로 구멍이 3개가 생긴다고 합니다. 


2-2. 질문의 해설 - 2단계 : Weli Conjectures, 베이유 가설의 설명

자 2단계로 넘어가 봅시다. Weli Conjectures, 과연 무엇일까요? 

 

저희가 먼저 봐야 할 숫자는 무려 3조가 넘습니다. 사람이 살면서 3조라는 숫자를 잘 사용 못할 정도여서 이렇게 차수가 같은 형식에, 그래프에 구멍 (genus)을 구할 수 있다면, 그 그래프에 점을 찍는 규칙은 사실 일정한 패턴이 있고, 그 패턴이 구멍의 수와 깊이 연관되어 있다!라는 게 베이유의 가설입니다.

 

정리를 하면 

1.x³y + y³z + z³x = 0에 공식에 맞으며,
2.x, y, z는 0이 아니지만, 같은 비율을 제외하고 나올 수 있는 개수를 샐 때
3.x³y + y³z + z³x = 0 공식은 차수가 같은 공식이어서 genus-degree formula에 맞는 공식이어서,
4. 해당 공식에 나오는 모든 경우의 수를 확인을 할 때 사용하는 공식은 Weil Conjectures입니다. 

 

Weil Conjectures를 왜 여기서 사용을 하나 확인을 해봤는데, 1. 만일 방정식이 있고 2. 숫자가 유한하게 제한이 되어있으며 3. 숫자 세트가 Fx^y로 적용이 된다면 사용되는 가설이라고 합니다. 

 

자, 가설의 공식은 아래와 같습니다. 

아 ㅋㅋ 이게 뭔데 진짜 씹덕아

오케이.. 설명을 조금 해볼까요? 

p^n는 숫자의 세트입니다. 

즉 이전에 말한 모든 숫자의 세트이니, 5 ¹⁸ 이 정답입니다. 거기에 +1이니 첫 부분은 이해를 했습니다. 

p는 5며, n는 18입니다. 

 

∑ 이거는 모든 경우의 수를 곱하는 겁니다.

여기서 g는 아까 genus-degree formula를 사용을 할 때 확인한 공식으로 g는 3인걸 확인을 했으니, p = 5, n = 18, g = 3인 거 까지는 확인을 했습니다. 

 

Weil Conjectures의 2번째 중 하나는, 절댓값 알파 i = 루트 p입니다. 루트는 거꾸로 이야기를 하면, 1/2의 제곱과 같은 성질이니.. 

아까 확인한 숫자에서 p는 5, 즉 알파 i는 루트 5와 같다고 생각하시면 됩니다. 

 

하지만 제대로 된 핵심 공식은 알파 i^n 

 

!

로 계산이 됩니다. 

 

 

즉 정리를 하자면 Weli Conjectures를 넣으면 

 

5 ¹⁸+1-? x 5⁹ 로 Weli Conjectures의 결괏값을 구할 수 있습니다. 


3. 그러면 정답은 5 ¹⁸+1-? x 5⁹? 

여기서 재밌는 질문이 나옵니다. 

 

? 는 뭘까요? 정답은 -6 이여서, 결국엔 5 ¹⁸+1-(-6) x 5⁹, 즉 5 ¹⁸+1+6 x 5⁹ = 3,814,708,984,376이라고 합니다. 

 

왜 -6 인지를 알기 위해서 배워야 하는게..

 

그 간단한 -6을 대체 어떻게 계산을 했길래 물어봤는데, 사실상 이놈도 지쳤는지 나중엔 '아 시바 그냥 외워'라는 식으로 답변을 줍니다. 

 

웬만하면 계속 물어봐서 이해를 하려고 했는데, Chebyshev와 Galois 작용 그리고 베이유 가설 자체가 1978년 수학계의 노벨상인 필즈상의 수상자인 피에르 들리뉴가 낸 업적 중 하나입니다. 단순한 대학원 수준의 수학 수준이 아니어서 여기서 못할 거 같습니다. 

 

다음엔 수능 수학으로 다시 도전해보겠습니다... 


4. 정리.. 

사실 3일 전부터 해당 글을 작성을 시작했습니다. 한 문제 푸는 것도 아닌 이해 하는데, 다 이해를 못 한 채로 글을 마무리하네요. 

 

사실 어느 정도 예상을 한 게 마이크로소프트의 논문 Textbook is All You Need의 논문을 보면 LLM은 결국 어떤 데이터와 어떤 prompt를 입력하는지의 복합적인 결괏값을 뱉는다!라는 주장을 해왔습니다. 단순하게 징징거리면서 '이해시켜 줘!'라고 하는 건 LLM도 잘 답변을 안 줍니다. 

 

 

o3는 해당 FrontierMath를 25.2 점을 맞았습니다. 

하지만 GPT의 발전도 보면 3.5가 나왔을 땐 16점, 하지만 저희가 지금 접근할 수 있는 o1 프리뷰는 97점, 단 2년 만에 이뤄낸 성과입니다. 

그리고 OpenAI는 아직 AGI다!라고 주장하는 모델이 안 나온 시점에서,
AI는 과연 얼마나 발전할 수 있을까요? 

 

반응형