본문 바로가기

deepseek9

프랑스가 만든 AI 미스트랄 업무능력테스트 ft.le chat(르샤) 프랑스가 만든 AI 미스트랄 업무능력테스트 ft.le chat(르샤)  https://youtu.be/j402p84MBrA프랑스가 가지고 있는 자국 언어에 대한 자존심은 익히 알려져 있습니다. 프랑스가 만든 인공지능 서비스에도 그 정신이 그대로 들어있는 것 같네요. 미스트랄이라는 LLM으 서비명은 le chat입니다.  le chat은 프랑스어로 고양이라는 뜻이라고 합니다. 르샤로 발음한다고 하네요. 이미지생성, 서치, canvas, code interpreter를 지원합니다. chatGPT나 gemini 등 대형 서비스들이 제공하는 기능은 대부분 제공하고 있습니다. 00:00 오프닝 및 미스트랄 소개 04:42 논리, 수학 테스트 12:18 엔지니어링 테스트(철근량 구하기) 13:33 코딩 테스트(2차.. 2025. 2. 11.
일론 머스크가 만든 인공지능 grok 2 성능은 어떨까? 논리.수학.엔지니어링.코딩 테스트 일론 머스크가 만든 인공지능 grok 2 성능은 어떨까? 논리.수학.엔지니어링.코딩 테스트 https://youtu.be/xwE7TLUeFSM일론 머스크가 만든 인공지능 grok 2. 유료사용자만 이용할 수 있었는데 지난해 말 일반 사용자들도 이용할 수 있게 공개했습니다. grok 2는 이미지 생성도 가능한데  검열이 약해서 유명인의 얼굴로도 이미지를 생성할 수 있는 것이 특징입니다. 썸네일의 일론머스크 표정도 grok에서 생성한 것입니다. grok 2의 업무능력을 테스트 해봤습니다. 논리.수학.엔지니어링(필요철근량산정), 코딩(2차방정식풀고그래프그리기,H빔단면그리고 단면적구하기) 00:00 오프닝 및 grok소개 03:08 논리.수학 능력 테스트(9개) 08:00 엔지니어링 능력 테스트(필요철근량 구하.. 2025. 2. 9.
오픈 LLM 큰형 Llama 3.3 70b 업무 능력 테스트(ft. Cerebras) 오픈 LLM 큰형 Llama 3.3 70b 업무 능력 테스트(ft. Cerebras) https://youtu.be/WpTcKri2qWk오픈 LLM의 큰형 격인 메타의 Llama 3.3 70b. deepseek r1의 출현으로 가장 큰 충격을 받은 회사가 메타가 아닐까 싶네요. 그동안 오픈 LLM 진형의 선두 주자였는데  deepseek r1 때문에 2인자로 밀려나게 생겼으니 말이죠. 그동안 deepseek r1, Qwen 2.5 max, Tulu 3 등 오픈 LLM의 업무능력을 테스트했었는데, Llama가 빠져있었던 것 같아서 Llama 3.3 70b을 테스트해봤습니다. Cerebras라는 inference 전용 칩을 만드는 회사의 서비르를 통해서 테스트를 해봤습니다. 00:00 오프닝 00:12 메타.. 2025. 2. 9.
구글 Gemini 2.0 pro 공개. flash thinking과 pro 성능 비교(논리,수학,엔지니어링,코딩) 구글 Gemini 2.0 pro 공개. flash thinking과 pro 성능 비교(논리,수학,엔지니어링,코딩) https://youtu.be/QTKbVxOc3bc구글이 2월 5일 Gemini 2.0 제품군을 공개했습니다. 2.0 pro. 2.0 flash, 2.0 flash-lite, 2.0 flash thinking 이중 최고 성능의 모델 2.0 pro와 추론 모델인 2.0 flash thinking의 성능비교를 해봤습니다. 논리/수학 문제 9개 , 엔지니어링(철근량산정),  코딩(2차방정식 근 구하고 그래프 그리기, I-beam그리기고 면적구하기)  총 12문제로 테스트 해봤습니다. gemini 2.0 공개 blog: https://blog.google/technology/google-deepmi.. 2025. 2. 7.