본문 바로가기

IT와 개발/AI 이야기30

Stable Diffusion 3.5 공개 Stable Diffusion 3.5가 출시 되었습니다. 이전 버전인 Stable Diffusion 3 Medium이 생각보다 시장 반응이 좋지 않았지만 해당 모델을 개선하기 보다는 새 버전을 출시하기로 하였다고 합니다. 이 과감한 결정이 좋은 선택이 될 수 있을까요? Stable Diffusion 3.5 Large, Stable Diffusion 3.5 Large Turbo가 공개 되었으며 앞으로 Stable Diffusion 3.5 Medium이 출시될 예정 (2024년 10월 29일)이라고 합니다. Stable Diffusion 3.5 Large는 80억개 이상의 파라미터를 가진 기본 모델로 이후 버전들은 더욱 발전된 성능을 가지고 있습니다. 또한 개인 컴퓨터에서 사용할 수 있도록 최적화도 진행 되.. 2024. 10. 29.
Apple 3D 비전 규칙을 새롭게 쓰는 AI 모델 'Depth Pro' 출시 LLM으로 관련 업계 전반이 뜨거울 때, 혼자 조용히 있었던 Apple이 새로운 비전 모델인 Depth Pro를 공개 했습니다. Depth Pro는 단안 카메라로 촬영된 영상에서 깊이 맵을 추정하는 AI 모델로 이전에 존재했던 깊이 맵 생성 모델보다 더 빠르면서 정확한 성능을 주장하고 있습니다. Apple이 아이폰의 카메라 애플리케이션의 기능을 확장한 것 뿐만 아니라 Vision Pro를 아직 버리지 않은 것 같습니다. 깊이 맵 추정은 인간과 객체 그리고 애플리케이션이 상호작용하는 모든 AR 분야에서 아주 큰 부분을 차지하고 있는 영역입니다. 특히 단안 카메라로 깊이 맵 추정이 가능하다는 것은 기기의 카메라 렌즈 수를 줄이거나 다른 기능의 렌즈를 더 추가할 수 있다는 의미도 되기 때문에 기기의 경량화나 .. 2024. 10. 15.
NVIDIA CEO Jensen Huang과의 대화 - AI와 에너지의 미래 AI와 에너지의 미래라는 주제에 대해 NVIDIA의 CEO Jensen Huang의 견해를 들을 수 있는 자리가 마련 되었습니다. 그는 AI가 비록 많은 에너지를 소비하지만 AI의 능력을 통해 에너지 절감이 가능해질 것으로 예상하고 있습니다. 또한 AI를 적용하는 협력 생태계를 조성하고, 정치인과 대중을 상대로 AI의 잠재력과 사용 방법에 대한 이해를 높이는데 주력하고 있습니다. 가까운 미래에 AI가 우리의 산업에 큰 부분을 차지할 것으로 예상하기 때문입니다. 그는 AI에 대해 어떤 생각을 하고 있는지? NVIDIA 라는 회사가 AI를 이용하여 어떤 미래를 그리고 있을지?에 대해 조금은 엿볼 수 있는 시간입니다. NVIDIA의 주식을 산 사람이라면 한 번 영상을 보시는 것도 좋을 것 같습니다.  출처: .. 2024. 10. 8.
The Intelligence Age Sam altman이 AI가 보편적 도구가 되는 지능 시대에 대한 이야기를 들려주고 있습니다. 그는 AI를 통해 인류가 누릴 수혜와 이를 위해 인류가 어떤 것을 준비해야 하는지에 대해서 이야기하고 있습니다. 특히 AI로 인한 위험성을 최소화 하도록 노력해야 하지만 노동 시장의 변화에 대해서 크게 걱정할 일이 아니라고 생각하는 점이 AI에 미친 인간답다는 생각이 듭니다. 그가 그리는 이상적인 지능 시대가 어떤 것인지 확인해 보세요. 100년 후 이 말이 우스갯소리가 될지, 아니면 시대를 앞서간 계몽의 메세지가 될지 예상해보는 것도 재미있는 시간이 될 것입니다. 출처: The Intelligence Age (samaltman.com) The Intelligence AgeIn the next couple of.. 2024. 10. 1.
Yi-Coder: A Small but Mighty LLM for Code 10억 미만의 파라미터로 막대한 컴퓨팅 자원을 요구하는 대형 LLM인 ChatGPT와 비슷하거나 뛰어난 성능을 보이는 새로운 코드 기반 LLM 모델이 소개 되었습니다.다양한 벤치마크에서 동등한 파라미터를 가진 LLM이나 그 이상의 컴퓨팅 파워를 요구하는 LLM 대비 높은 성능을 보이고 있으며, 기본 버전과 채팅 버전을 모두 오픈 소스로 제공하고 있습니다. 오랜만에 출시된 코드 기반 LLM으로 오픈 소스 기반, 그리고 적은 파라미터로 좋은 성능인 것을 강조하고 있습니다. 아무래도 개발 기업의 경우 라이선스 문제나 내부 기술 유출로 클라우드 기반 LLM을 사용하기에는 결정에 고민이 필요할 겁니다.최근들어 많은 LLM 기업들이 오픈 소스 기반을 내세우고 있으며, 온 디바이스를 위해 모델의 경량화와 성능 향상을.. 2024. 9. 24.
AI Apocalypse: 80% of Projects Crash and Burn 현재 많은 기업에서 AI 모델을 출시하고 있으며, 몇몇 기업은 이미 성공적인 모습을 보여주고 있습니다. 이러한 선도 기업들의 모습은 후발주자들이 보기에 손에 잡힐듯한 위치에 아른아른거리는 아지랑이처럼 보일 수 있습니다. 하지만 생각만큼 선도 기업들과 어깨를 나란히 하는 후발주자들이 많지 않습니다. 왜 그럴까요? 이 보고서가 저 물음에 대한 완벽한 대답은 아니지만 성공하지 못하는 원인 중의 일부를 설명하고 있는 것으로 보입니다. 부디 좋은 참고가 되었으면 합니다.  출처: AI Apocalypse: 80% of Projects Crash and Burn, Billions Wasted says RAND Report - SalesforceDevops.net AI Apocalypse: 80% of Project.. 2024. 9. 17.
Llama is the leading engine of AI innovation Llama 모델은 지금까지 3억 5천만 다운로드에 가까워지고 있으며, 지난 달에만 2천만 건 이상 다운로드되어 주요 오픈 소스 모델 패밀리로 자리 잡았습니다. 즉, Llama 생태계는 급속도로 성장하고 있으며 이는 약 1년 전 대비 10배 이상 증가한 수치입니다. 이러한 빠른 성장에는 비용 효율적이면서 높은 성능이 필요하다는 기업들의 니즈를 잘 충족시키고 있는 Llama의 전략이 기저에 깔려있는 것으로 보입니다. 오픈 소스를 통해 모델의 확산과 다양한 의견 수렴 및 발전은 이러한 Llama의 전략을 한층 더 지지해 주고 있습니다. 다만 오픈 소스 모델이기 때문에 가지는 편향성이나 윤리 문제, 그리고 보안 문제 등은 여전히 보수적인 방식의 접근이 필요할 것으로 보입니다. 아직 사용해보시지 않으셨나요? 한 .. 2024. 9. 10.
Zed AI 소개 Zed에서 Anthropic과 협업을 통해 개발을 강력히 지원하는 코딩 지원 Zed AI를 소개하였습니다. Claude 3.5 Sonnet을 기반으로 한 AI 지원 코딩 서비스로 텍스트 편집에 최적화 되어 고트 리팩토링과 문서 편집을 거의 실시간으로 수행할 수 있다고 소개 하고 있습니다. 간만에 새로운 AI 도구가 출시 되었습니다. 물론 완전 새로운 모델은 아니고 Claude 3.5 Sonnet 기반이지만 개발에 특화된 AI 도구는 Meta의 Llama 이후로 오랜만이긴 합니다. 개발자들이 특히나 관심 가질만한 AI 도구이니 씹고 뜯고 맛보고 즐기시기 바랍니다.  출처: Introducing Zed AI Introducing Zed AI - Zed BlogPowerful AI-assisted coding.. 2024. 9. 3.
Fine-tuning: GPT-4o OpenAI가 특정 사용 사례에 대해 더 낮은 비용으로 더 높은 성능을 제공하기 위해 사용자들에게 GPT-4o fine-tuning 기능을 제공합니다. AI의 개인화가 가속화 되고 있는데 제 머릿속에는 영화 "her"이 떠오릅니다. 예전에 stable-diffusion 모델이 유출되면서 일반인에게 AI 도구가 풀렸을 때 사람들이 어디까지 할 수 있는지 확인할 수 있었고 꽤 인상적이었습니다. 내 손안의 AI를 바라신다면 한 번 경험해 보는 것도 좋을 것 같습니다.  출처: Fine-tuning now available for GPT-4o | OpenAI  오늘, 개발자들이 가장 많이 요청한 기능 중 하나인 GPT-4o에 대한 fine-tuning을 출시합니다. 또한 9월 23일까지 모든 조직에 하루에 10.. 2024. 8. 27.
OpenAI: SearchGPT Prototype 검색의 초기에는 키워드-텍스트 기반으로 질의를 주면 해당 질의에 대한 연관성이 높은 사이트 또는 문서들을 답변으로 주었습니다. 중기에는 키워드(또는 문장)-텍스트 기반의 질의를 주면 미디어를 답변으로 주었습니다. 물론 검색하는 곳이 유튜브와 같은 플랫폼으로 옮겨간 것도 한 몫 하였습니다. 요즘은 어떨까요? 답변을 보는 방식이 달라질지언정 질의를 하는 방식 자체는 크게 변화가 없을 겁니다. OpenAI가 새로운 방식의 질의 도구를 SearchGPT란 이름으로 소개하였습니다. 내가 묻고자 하는 것을 키워드 기반이 아닌 문장과 설명으로 제공할 수 있도록 하였습니다. 질의의 상세화 그리고 고도화라고 할 수 있습니다. 이 방법이 과연 기존 검색 방법을 밀어내고 새로운 검색 방법으로 자리 잡을 수 있을까요? 프로토.. 2024. 8. 20.
Figure 02 Figure 02 Trailer: https://youtu.be/FZbY9sReu1k   Introducing Figure 02: https://youtu.be/0SRVJaOg9Co  하드웨어매트 블랙 마감의 외피를 가지고 있으며, 이는 이전 모델의 크롬 메탈 마감과 차별화 됨모든 케이블을 로봇 신체 내부로 통합하여 외부 환경으로부터 보호함배터리 용량이 Figure 01 대비 50% (2.25kWH) 개선배터리를 몸통 안에 통합함으로써 무게 중심을 로봇의 중심선에 더 가깝도록 하여 민첩성을 향상함각 관절의 전력과 성능을 최적화 할 수 있도록 맞춤형 모터를 제작 및 탑재했으며, 모터는 로봇 관절의 구동렬과 통합함최대 25kg의 물건을 운반할 수 있으며, 사람과 같은 손목과 5개의 손가락은 센서와 모터를 포.. 2024. 8. 6.
Llama 3.1 소개: 지금까지 가장 뛰어난 모델 Meta에서 128K 컨택스트 길이를 가지고 8개의 언어를 지원하는 Llama 3.1 405B 모델을 소개 하였습니다. 사용자가 자신의 요구 사항과 애플리케이션에 맞게 모델을 완전히 사용자 정의하고, 새로운 데이터 세트에서 학습하고, 추가 미세 조정을 수행할 수 있으며 이러한 결과를 Meta와 공유하지 않아도 됩니다.성능 측면에서는 GPT-4, GPT-4o, Claude 3.5 Sonnet을 포함한 다양한 모델들과 비교했을 때 비슷하거나 나은 수준을 보여주고 있습니다.물론 이런 대규모 모델을 개인 컴퓨터에서 빌드하고 실행하기 위한 다양한 조치도 포함되어 있습니다. 8B 및 70B 모델 사용자도 섭섭하지 않게 업그레이드된 버전을 제공한다고 합니다. Meta는 다른 경쟁사와는 다르게 Open source 주.. 2024. 7. 30.
GPT-4o mini: 비용 효율적인 지능 향상 OpenAI가 비용 효율적인 소형 AI 모델인 GPT-4o mini를 출시했습니다. 이 모델은 백만 개의 입력 토큰당 15센트, 백만 개의 출력 토큰당 60센트로 저렴한 비용에 높은 성능을 제공한다고 합니다. GPT-4o mini는 텍스트 지능과 multimodal 추론에서 뛰어난 성능을 발휘하며, 강력한 안전 조치를 위해 70명 이상의 외부 전문가들이 철저히 테스트를 진행했다고 합니다. 자세한 내용은 곧 공개될 GPT-4o 시스템 카드와 대비 점수 카드에서 확인할 수 있다고 합니다. OpenAI에서 GPT-3.5 보다 비용이 저렴하면서 성능이 좋은 GPT-4o mini를 선보였습니다. 사용자들은 GPT-3.5 대신 GPT-4o mini를 사용할 수 있게 되었는데요. 정말 Open AI에서 제시한 성능대.. 2024. 7. 23.
Stable Diffusion 3 출시 Stable Diffusion 3 Medium이 출시 되었습니다. 이 모델은 뛰어난 세부 묘사, 색상 및 조명을 통해 사진 같은 이미지를 제공하며, 유연한 스타일의 고품질 출력도 가능하다고 얘기하고 있습니다. 또한 손과 얼굴의 사실성 등 다른 모델의 일반적인 단점을 혁신적인 16채널 VAE를 통해 극복했으며 긴 문장이나 복잡한 지시사항, 공간적 추론, 구성 요소, 동작 및 스타일을 이해하며, 세 가지 텍스트 인코더를 모두 사용하거나 조합하여 성능과 효율성을 조절할 수 있다고 합니다.Diffusion Transformer 아키텍처를 활용해 철자, 자간, 글자 형성 및 간격에서 전례 없는 텍스트 품질을 구현하며, 낮은 VRAM 사용량 덕분에 성능 저하 없이 일반 소비자 GPU에서도 이상적으로 작동한다고 합니.. 2024. 7. 9.
Apple WWDC 2024 WWDC 2024에서 Apple은 Vision OS 2와 iOS 18의 다양한 업데이트를 통해 사용자 경험을 혁신했습니다. AirPods의 새로운 기능, Home 및 tvOS의 개선 사항, 그리고 watchOS 11의 건강 및 운동 기능 업데이트와 함께 Apple은 개인화된 인텔리전스 시스템인 Apple Intelligence를 소개했습니다. 이 시스템은 자연어 이해와 생성 모델을 활용해 사용자 경험을 향상시키며, 이를 통해 한 단계 더 발전한 Siri의 기능을 확인할 수 있었습니다. 이러한 변화는 Apple의 생태계를 더욱 단단히 통합하고, 사용자에게 더 자연스러운 편의를 제공하게 되었습니다. 아래 영상이나 요약을 통해 Apple이 어떤 혁신을 보여주었는지 확인해 보시면 좋을 것 같습니다.  출처: h.. 2024. 7. 2.