본문 바로가기
카테고리 없음

1조개의 파라메터. Kimi K2 드디어 Think 기능 탑재. 논리,수학,엔지니어링,코딩 성능테스트

by 돌종 2025. 11. 15.

1조개의 파라메터. Kimi K2 드디어 Think 기능 탑재. 논리,수학,엔지니어링,코딩 성능테스트

https://youtu.be/BkoJBo9uT60

1조개 파라메터 오픈 모델 Kimi K2가 Think기능을 탑재해서 공개됐습니다.

1조개의 토털 파라메터 액티브 32B의 MoE스트럭처입니다.

벤치마크에서도 최상급의 상업모델들과 비슷한 점수를 보여주고 있습니다.
아직 멀티모달이 아니라는 것을 제외하고는 탑클래스 상업모델과 비슷한 성능을 보여주고 있습니다.

Kimi K2 Think에 대해서
논리,수학,엔지니어링(계산),코딩 능력을 테스트해봤습니다.

테스트는 http://www.kimi.com에서 진행했습니다.

00:00 오프닝 및 소개.
05:18 논리,수학,계산 문제 테스트(9문제)
06:41 엔지니어링문제(철근량산정)
06:53 코딩문제(2차방정식 수식랜더링,그래프)
07:14 코딩문제(H빔단면적 산정 및 단면도 작성)
07:30 엔지니어링문제(H빔의 최대응력 산정)
07:41 코딩문제(교대단면도 작성 및 도면 뷰어기능)
08:24 테스트 최종 결과 및 마무리

지난 영상(Kimi K2 0905(Non Think))
https://youtu.be/C6nhmjAA0ls?si=LCFADMhA-wOw4KWX

관련 link
https://huggingface.co/moonshotai/Kimi-K2-Thinking
https://www.kimi.com/chat/

테스트 결과 시트 공유
https://docs.google.com/spreadsheets/d/1l2LVcFs5DlIiDrkMmHht1004iZRFzClkEp8agy0KiHA/edit?gid=1278489464#gid=1278489464

테스트 문제 프롬프트
https://blog.naver.com/dolljong/223961139070

#AI #인공지능 #kimi-k2-Think #Moonshot #LLM #Agent
#deepseek #gemini #claude #chatGPT #Grok #코딩 #coding
#토질및기초기술사 #토목구조기술사 #토목시공기술사 
#토목기사 #건설환경공학 #철도기술사 #상하수도기술사