본문 바로가기

LLM2

AI 모델의 생각 방식에 대한 연구 Anthropic에서 LLM의 Mind map을 이해하는데 상당한 진전을 보이고 있습니다. Claude Sonnet LLM의 내부에서 수백만개의 개념이 어떤 방법으로 구성되었는지 확인했으며 이는 현대의 프로덕션급 LLM의 내부를 상세히 들여다본 최초의 사례라고 할 수 있습니다.작은 모델부터 시작해서 큰 모델까지 분석의 범위를 넓혀 갔으며 모델이 답변을 도출하기까지의 인과 관계와 안전성을 위협할 수 있는 가능성에 대해서 확인하였습니다.Anthropic은 모델의 안전성을 더욱 개선하기 위해 이러한 연구를 계속할 것이며 아직은 시작 단계일 뿐 해야할 일이 많다고 끝을 맺었는데요.인간과 유사한 기능을 하는 모델은 인간과 유사하게 생각하는 것이 아닌 것인지? 반대로 모델의 생각 방식을 규명하면 사람의 생각 방식도.. 2024. 5. 28.
Meta Llama 3: 오늘 날 가장 뛰어난 LLM 소개 Meta에서 8B와 70B 두 종류의 Lama 3 모델을 공개 하였습니다. 동등한 크기의 경쟁 모델과 비교했을 때 전혀 손색 없는 성능을 보이면서 더욱 가벼운 모델로 소개 하고 있습니다. 또한, AI 모델의 악용과 환각에 대해서 충분한 검증과 안전을 위한 조치를 취했다는 점을 강조하는 것으로 보아 Generative AI 모델의 문제점을 깊이 이해하고 있음을 보여주고 있습니다.특히 Meta는 기업 내에서 폐쇄적으로 모델을 개발하고, 학습 및 성능 검증 후 외부에 공개하는 것에 반해 개발 단계에서 부터 소스를 공개하여 여러 사람들과 함께 개발하는 오픈 소스의 행보를 보여주고 있습니다. 오픈 소스 주의가 결국 더 나은 미래로 이끌 것이라는 Meta의 이 행보는 주목할만한 것으로 생각 됩니다.웹 페이지는 아직.. 2024. 4. 30.