본문 바로가기

deepseek10

완성체 AI KIMI (추론, 멀티모달, 검색) 성능 테스트 완성체 AI KIMI (추론, 멀티모달, 검색) 성능 테스트 https://youtu.be/UEGYOI2D8D8deepseek, Qwen에 밀려 잘 알려지지 안은 중국의 또 다른 AI모델 KIMI 추론 기능을 갖추고 멀티모달과 검색까지 지원하는 완성체 AI서비스. 게다가, 현재 완전 무료입니다. kimi.ai 성능테스트를 해봤습니다. 00:00 Kimi 소개 04:37 kimi의 기능 소개 04:33 비전 리스닝 (옹벽 안정 검토) 05:14 검색 기능 06:02 RAG (pdf, 교량설계기준) 06:40 RAG (xls, 교량현황) 09:20 RAG (doc, 콘크리트기준) 12:04 논리,수학,엔지니어링,코딩 테스트(추론 OFF) 21:50 논리,수학,엔지니어링,코딩 테스트(추론 ON) 28:43 테.. 2025. 2. 14.
프랑스가 만든 AI 미스트랄 업무능력테스트 ft.le chat(르샤) 프랑스가 만든 AI 미스트랄 업무능력테스트 ft.le chat(르샤)  https://youtu.be/j402p84MBrA프랑스가 가지고 있는 자국 언어에 대한 자존심은 익히 알려져 있습니다. 프랑스가 만든 인공지능 서비스에도 그 정신이 그대로 들어있는 것 같네요. 미스트랄이라는 LLM으 서비명은 le chat입니다.  le chat은 프랑스어로 고양이라는 뜻이라고 합니다. 르샤로 발음한다고 하네요. 이미지생성, 서치, canvas, code interpreter를 지원합니다. chatGPT나 gemini 등 대형 서비스들이 제공하는 기능은 대부분 제공하고 있습니다. 00:00 오프닝 및 미스트랄 소개 04:42 논리, 수학 테스트 12:18 엔지니어링 테스트(철근량 구하기) 13:33 코딩 테스트(2차.. 2025. 2. 11.
일론 머스크가 만든 인공지능 grok 2 성능은 어떨까? 논리.수학.엔지니어링.코딩 테스트 일론 머스크가 만든 인공지능 grok 2 성능은 어떨까? 논리.수학.엔지니어링.코딩 테스트 https://youtu.be/xwE7TLUeFSM일론 머스크가 만든 인공지능 grok 2. 유료사용자만 이용할 수 있었는데 지난해 말 일반 사용자들도 이용할 수 있게 공개했습니다. grok 2는 이미지 생성도 가능한데  검열이 약해서 유명인의 얼굴로도 이미지를 생성할 수 있는 것이 특징입니다. 썸네일의 일론머스크 표정도 grok에서 생성한 것입니다. grok 2의 업무능력을 테스트 해봤습니다. 논리.수학.엔지니어링(필요철근량산정), 코딩(2차방정식풀고그래프그리기,H빔단면그리고 단면적구하기) 00:00 오프닝 및 grok소개 03:08 논리.수학 능력 테스트(9개) 08:00 엔지니어링 능력 테스트(필요철근량 구하.. 2025. 2. 9.
오픈 LLM 큰형 Llama 3.3 70b 업무 능력 테스트(ft. Cerebras) 오픈 LLM 큰형 Llama 3.3 70b 업무 능력 테스트(ft. Cerebras) https://youtu.be/WpTcKri2qWk오픈 LLM의 큰형 격인 메타의 Llama 3.3 70b. deepseek r1의 출현으로 가장 큰 충격을 받은 회사가 메타가 아닐까 싶네요. 그동안 오픈 LLM 진형의 선두 주자였는데  deepseek r1 때문에 2인자로 밀려나게 생겼으니 말이죠. 그동안 deepseek r1, Qwen 2.5 max, Tulu 3 등 오픈 LLM의 업무능력을 테스트했었는데, Llama가 빠져있었던 것 같아서 Llama 3.3 70b을 테스트해봤습니다. Cerebras라는 inference 전용 칩을 만드는 회사의 서비르를 통해서 테스트를 해봤습니다. 00:00 오프닝 00:12 메타.. 2025. 2. 9.