본문 바로가기

인공지능45

틱톡의 경쟁사 Rednote가 만든 LLM 논리,수학,코딩 테스트(새로운 문제 2개 추가) 틱톡의 경쟁사 Rednote가 만든 LLM 논리,수학,코딩 테스트(새로운 문제 2개 추가) https://youtu.be/CYGiuEAkeVc틱톡의 경쟁자로 알려진 Rednote를 만든 샤호홍수가 공개한 LLM. DotsLLM1 전체 142b, 액티브 14b의 MoE구조. 00:00 오프닝 및 소개 00:02:44 새로운 문제 소개. 13번: H빔 응력 산정 00:03:11 새로운 문제 소개. 14번: 교대 단면도 그리기(치수선,줌인아웃 기능) 00:04:12 14개 논리,수학,코딩 테스트 00:14:14 테스트 결과 및 마무리 관련 Link https://huggingface.co/rednote-hilab/dots.llm1.inst테스트 결과 시트 공유 https://docs.google.com/s.. 2025. 6. 8.
[엔지니어링자동화] 단면계수 구하는 프로그램 만들어줘! Claude, Gemini, Grok, ChatGPT, Perplexity [엔지니어링자동화] 단면계수 구하는 프로그램 만들어줘! Claude, Gemini, Grok, ChatGPT, Perplexity https://youtu.be/JnY1LWhNq24폐곡선의 좌표를 입력하면 단면계수(A,Ix,Iy)를 구해주는 프로그램을 AI에게 시켜봤습니다. 이제는 AI들이 어느정도 수준으로 올라온 것 같습니다. 아래의 AI서비스들을 테스트 해봤습니다. 특히 Perplexity는 단순히 검색만 하는 것은 아니고 코딩도 해줍니다. Claude Opus 4 Gemini 2.5 pro Grok 3 chatGPT o3 Perplexity Labs 00:00:00 오프닝 및 소개 00:02:05 프롬프트 소개 (1st try) 00:04:40 Claude opus 4 00:08:45 Gemini .. 2025. 6. 5.
알리익스프레스의 주인 알리바바의 추론 AI. Qweb 2.5 max(Think) 업무 능력 테스트 알리익스프레스의 주인 알리바바의 추론 AI. Qweb 2.5 max(Think) 업무 능력 테스트 https://youtu.be/2-fkO-TtPTg알리익스프레스로 국내에도 많이 알려진 알리바바가 만든  Qwen 2.5 max (think)가 추론 기능을 통합했습니다. 중국에는 deepseek r1만 있는 것이 아닙니다. 추론 기능을 갖추고 있는 모델만 하더라도 세개나 되네요. deepseek의 deepseek r1 알리바바의 Qwen 2.5 max 문샷AI의 Kimi k1.5 Qwen 2.5 max의 think 기능으로 논리,수학,코딩문제를 풀어봤습니다. #AI #인공지능 #Qwen #알리바바 #알리익스프레스  #deepseek #chatGPT #claude #grok #gemini #토목구조기술사 #.. 2025. 4. 1.
진짜 지구 최강 인공지능! Claude 3.7 sonnet 업무 능력 테스트 진짜 지구 최강 인공지능! Claude 3.7 sonnet 업무 능력 테스트 https://youtu.be/SH3Fbh1oFLQ일론 머스크가 grok 3가 지구 최강이라고 자랑을 했지만 진짜 지구 최강 인공지능이 발표됐습니다. 글쓰기나 코딩 전문가들 사이에서 가장 인기가 높았던 claude가 3.7 버전을 공개했습니다. 이번 3.7 sonnet 버전에는 Extended 옵션이 추가되었는데 이 옵션이 다른 모델에서 Think 또는 Reasoning이라고 표현하는 기능입니다. Claude 3.7 sonnet은 특히 코딩에 뛰어난 것으로 나타났습니다. Anthropic에서는 claude code도 공개를 했는데 명령창에서 코딩을 도와주는 기능입니다. 모델을 만든 회사에서 직접 코딩 툴을 공개한 것은 이번이 처.. 2025. 4. 1.