본문 바로가기

토목구조기술사122

놀라운 속도와 정확성! Gemini 2.5 Flash-Lite Preview 06-17 논리,수학,엔지니어링,코딩 테스트 놀라운 속도와 정확성! Gemini 2.5 Flash-Lite Preview 06-17 논리,수학,엔지니어링,코딩 테스트 https://youtu.be/3GPaaCGfXdQ구글이 Gemini 2.5 3개 모델을 업데이트했습니다. Gemini 2.5 pro, Gemini 2.5 Flash, Gemini 2.5 Flash Lite Preview 06-17입니다. 이중 가장 작고 빠르고, 비용효율적인 모델인 Gemini 2.5 Flash Lite Preview 06-17을 테스트해봤습니다. 00:00 오프닝 및 모델 소개 02:58 API 가격 03:43 API가격 비교. 05:22 논리,수학 능력 테스트 (9개 문제) 09:48 엔지니어링 문제 (필요 철근량 산정) 11:18 코딩 문제 (2차방정식 근.. 2025. 6. 19.
오픈웨이트 모델중 최강급. Minimax M1. 논리,수학,엔지니어링,코딩 테스트 https://youtu.be/m4YLTqG0w68오픈웨이트 모델중 최강급. Minimax M1. 논리,수학,엔지니어링,코딩 테스트Minimax M1 모델이 공개됐습니다. 오픈웨이트 모델 모델 중 가장 강력한 모델은 Deekseek r1인데 Deepseek r1과 비슷한 성능을 보인다고 주장하고 있습니다. 이 모델을 만든 minimx 사이트에는 영상생성,음성생성,에이전트 등을 서비스하고 있습니다. 순수한 LLM을 만드는 Deepseek과는 다른 규모인 것 같습니다. 에이전트도 테스트를 해봤습니다. 주어진 테스크에 대해서 스스로 계획을 세우고 검색기능과 코딩기능 등을 활용하는 기능입니다. 예전에 이 모델에 대해서 4백만토큰의 첨부파일을 지원한다고 해서 용량이 큰 구조계산서 엑셀파일을 올리고 질문했던 적이 .. 2025. 6. 18.
OpenAI o3-pro 정말 최선인가? 논리,수학,엔지니어링,코딩 테스트 OpenAI의 o3모델은 현재 가장 진보된 모델입니다.o4-mini가 있기는 하지만 아직 mini가 붙어 있어서 o3가 가장 진보된 모델이라고 할 수 있습니다. 그런데 6월10일 OpenAI는 o3-pro버전을 릴리즈했습니다.o3-pro버전은 모델명이 다른 게 아니라 더 길게 생각하는 버전이라고 설명하고 있습니다.과연 시간이 매우 많이 걸립니다.제가 평소에 LLM을 테스트하는 14개 문제를 푸는데 거의 3시간이 걸렸습니다.단순한 문제들은 추론 없이 풀어도 되는데 무조건 추론을 길게 하는 거 같습니다. 단순한 문제에는 권장하지 않습니다.복잡한 문제에만 적용하실 건을 권장합니다. OpenAI o3-pro 정말 최선인가? 논리,수학,엔지니어링,코딩 테스트 https://youtu.be/D6o1O_iKHCUOp.. 2025. 6. 17.
프랑스의 저력. Mistral AI. 추론 기능 탑재한 Magistral(논리,수학,코딩 능력 테스트) https://youtu.be/MjYqPO7KOf4 프랑스의 저력. Mistral AI. 추론 기능 탑재한 Magistral(논리,수학,코딩 능력 테스트) 프랑스는 여기 저력이 있었습니다. 그동안 Mistral AI는 Mistral, Codestral, Devestral 등으로 꾸준히 업그레이드하면서 발표했었는데 드디어 추론기능(Reasoning)이 탑재된 Magistral 2506 버전을 공개했습니다. 이 모델은 엔터프라이즈용 Magistral Medium과 오픈웨이트 모델인 Magistral Small로 나누어서 공개되었습니다. Mistral AI가 제공하는 무료 API로 OpenWebUI환경에서 테스트를 했습니다. 00:00 오프닝 및 모델 소개 04:31 테스트 방법 소개 (무료 API+Open.. 2025. 6. 16.