다가오는 AIMO phase3에서, 자연어 Math Word Problem을 Lean4 코드로 맵핑하기 위해 모델 훈련 레시피가 필요
어떤 데이터셋을 썻고, 어떤 훈련 방법을 썻는지?
Notes
방법론
자연어 수학 문제를 읽고 formal(Lean4로 된) statement를 생성
model scoring과 hypothesis rejection을 통해 생성한 statement 중high-quality만 남김
statement를 DeepSeek-prover가 Lean4로 된 proof을 생성. 생성한 proof은 Lean4로 돌려서 검증. 이렇게 하면 좋은 formalized statements, proof 쌍을 얻는다.
이렇게 얻은 자연어 수학문제 - Lean4 statements, proof 으로 DeepSeek-prover를 FT하고 더이상의 성능 상승이 없을때까지 1단계부터 다시 반복
이러면 초기 모델부터 proof을 어느정도 잘 생성한다는 소리가 되는데, 알고보니 DeepSeek-Math Base를 쓴다
3단계를 할 때, original statement과 그 반증을 동시에 트라이. 만일 반증이 성공하면 즉시 original statement를 버림으로서 효율적인 프로세스
MMA 데이터셋은 Lean4 mathlib에 있는 statements를 GPT-4를 이용해 자연어 문제로 역번역 한 데이터셋
MMA 데이터셋을 이용해 모델이 MWP를를 Lean4 formal statement로 번역하게 instruct
Prompt
Mathematical Problem in Natural Language:{informal statement with answers}Translate the problem to Lean4 (only the core declaration):```Lean4**Response**{formal statement}