본문 바로가기

Biusiness Insight/Computer Science

Google I/O 2023 키노트 요약

반응형

Google I/O 2023 키노트 한 줄 요약

  • 이번 구글 I/O 2023의 한 줄 요약은 『 AI 와 생성형 AI (Generative AI) 』 였다.
  • AI-퍼스트 (AI-First) 전략으로 구글의 다양한 제품에 AI를 적용하고, 생성형 AI를 기반으로 진화해나갈 예정이다.

(자세한 내용은 아래 내용과 영상을 참조)

Google I/O 2023 키노트 - 10분 요약 버전 (Google Youtube)

 

구글 제품에 추가될 AI 기능

1. " Help me write " on 지메일 (Gmail), 워크스페이스 (Google Workspace) 

  • Google은 이메일 작성을 도와주는 "Help me write"라는 기능을 개발했다.이 기능은 방대한 텍스트 및 코드 데이터 세트로 학습된 생성형 AI를 사용한다.
    1. 스마트 답장 (Smart Reply) : 한 번의 클릭으로 짧은 답장을 회신 (2017년 런칭)
    2. 스마트 편지쓰기 (Smart Compose) : 글자를 입력하면 문구를 제안 (구글 워크스페이스에서 1,800억회 사용됨)
    3. 작성 지원 (Help me write) : 생성형AI 기반 작성 지원 기능
  • 사용자가 이메일 초안을 만들고 항공편 정보와 같은 기존 메일의 데이터를 가져올 수 있어, 메일 작성을 더 쉽게하고 사용자의 시간을 절약할 수 있다.
    • 예) 항공권 취소 메일 수령 시, 전액 환불을 원할 경우, 사용자는 "전액 환불을 요청하는 이메일" 이라는 명령어를 간단하게 입력하고 작성 버튼을 누르면, 기존의 이메일에서 항공권 정보까지 가져와 사람이 작성한 것과 거의 유사한 메일의 초안을 자동으로 작성한다.
  • 이 기능은 추후 워크스페이스(Google Workspace)에 업데이트 될 것
"Help me write" 기능 - 주제를 입력하면 위치, 상태와 같은 정보를 포함하여 문서 초안이 작성됨 (Google Workspace)

 

2. " Immersive View for routes " on 구글 지도 (Google Maps)

  • 사용자가 목적지까지의 경로를 미리 볼 수 있는 새로운 "Immersive View for routes" 기능을 Google 지도에 도입한다.
  •  AI를 통해, 사용자의 기기에서 실제 장소의 360도 파노라마 이미지를 제공하며, 사용자가 경로 상의 교통량, 날씨 등의 정보들을 확인할 수 있다. 이를 통해 사용자는 목적지까지 가는 경로를 더 잘 계획하는 데 도움이 될 수 있을 것이다.
  • '23년 여름 15개 도시에서 출시될 예정, '23년 말까지 전 세계로 확대될 예정이다.

"Immersive Views for routes" 기능 - 경로에 대해 필요한 모든 정보를 사용자 기기에서 확인할 수 있음 (Google Maps)

 

3. 매직 에디터 (Magic Editor)  on 구글 포토 (Google Photo)

  • 의미론적 이해(Semantic understanding) 및 생성형 AI기술을 조합한 매직 에디터(Magic Editor) 기능을 출시할 예정이며, 이를 통해 Google 포토는 AI를 사용하여 사진을 더 잘 편집할 수 있다.
    • 참고: 기존에 픽셀에 탑재 매직 지우개 (Magic Eraser)기능은 AI 기반으로 이미지 내에서 불필요한 요소를 삭제한다.
  • 매직 에디터(Magic Editor) 기능을 통해 사용자가 사진을 편집하고, 불필요한 요소를 제거하고, 새로운 요소를 추가할 수 있어 사진을 더 쉽게 편집하고 창의적으로 만들 수 있다.
  • 매직 에디터는 올해 안에 출시될 예정이다.

매직 에디터 (Magic Editor) 기능 - 구글 포토(Google Photo)에서 활용가능 하다. (예: 아이의 위치를 사진 중앙으로 옮기고, 배경에 있던 풍선이 잘린 부분을 생성해주고, 하늘을 만들어 주었다.)

 

4. AI 를 모두에게 더 유용하게 만들기

  • 지메일, 구글 지도, 구글 포토 등 위에서 소개된 예시 외에도 AI 기술을 활용해 구글의 제품들을 사용하는 사용자들의 경험을 최대로 할 수 있도록 지속적으로 연구하고 있다.
  • 구글의 사명 『전 세계의 정보를 체계화하여 누구나 편리하게 이용할 수 있도록 하는 것 (to organize the world's information and make it universally accessible and useful)』을 실현하기 위해, 구글의 15개 제품을 각 5억 명 이상의 이용자와 기업에 서비스를 제공하고 있으며, 6개 제품은 각 20억명 이상의 이용자에게 서비스를 제공하고 있다.
  • 향후 모든 사람들에게 도움이 되는 AI 기술을 구현하는 것이 구글이 지향하는 바를 향해 나아가는 근본적인 방법이다. 이를 위해 구글은 아래 4가지 중요한 기준에 따라 AI 기술을 개발하고 있다.
    1. 지식과 학습을 향상시키고, 세상을 더 깊이 이해 함으로써
      First, by improving your knowledge and learning, and depending your understanding of the world
    2. 창의성과 생산성을 높여, 자신을 표현하고 능동적으로 업무를 처리할 수 있도록 지원한다.
      Second, by boosting creativity and productivity, so you can express yourself and get things done
    3. 개발자와 기업이 혁신적인 제품과 서비스를 스스로 구축할 수 있도록 지원한다.
      Third, by enabling developers and business to build their own transformative products and services
    4. 모든 사용자가 동등하게 혜택을 누릴 수 있도록 책임있는 방식으로 AI 기술을 적용한다.
      And finally, by building and deploying AI responsibly, so that everyone can benefit equally

 

구글의 생성형 AI

1. 구글의 생성형 AI 모델 : PaLM2 와 Gemini (제미니)

  • '22년 4월 발표된 PaLM(Pathways Language Model)은 약 5,400억개의 파라미터 기반 대규모 언어모델(LLM)이다.
  • '23년 5월 발표된 PaLM2는 지난해 발표된 PaLM의 업그레이드 버전으로 파라미터 수는 동일하다.
  • 차세대 모델인 멀티모달 제미니(Genimi)를 개발중이다.
  • PaLM2는 모델의 크기와 특장점 기능에 따라 게코(Gecko), 오터(Otter), 바이슨(Bison), 유니콘(Unicorn)으로 분류되며, 게코(Gecko)는 모바일에서 동작할만큼 가볍고 빠르다.
  • PaLM2 논문(기술문서) 다운로드

palm2techreport.pdf
4.85MB

  • PaLM2는 과학, 수학 등 주제에 대한 광범위한 학습을 기반으로 논리와 추론 능력이 더욱 강화되었고, 100여개 이상의 언어에 걸친 다국어 학습을 통해 각 언어별 미묘한 차이를 이해하고 결과를 생성해낸다.
  • 또한 강력한 코딩 기능으로 전세계 개발자들과 협업을 할 수도 있다.

Google PaLM2 의 코딩 기능 - Python 및 JavaScript 등 프로그래밍 언어에서 코드를 생성할 수 있다. (Google AI)

 

  • PaLM2는 뛰어난 기능을 가지고 있지만, Domain별 지식에 Fine-tuning 하여 활용되면 더욱 진가를 발휘한다.
  • Sec-PaLM (보안) : AI 기반으로 악성 스크립트를 더 잘 탐지
  • Med-PaLM (의료) : 의학 지식에 맞춰 Fine-tunning하여, 의사면허 시험 문제에 '전문가'수준 성능을 보였으며, 현재 의료 영상 정보 합성 기능을 추가하는 중

 

2. AI 윤리 : AI가 생성한 컨텐츠를 판별하는 도구들

  • AI 활용에 대한 책임감에 주의를 기울이고, 사용자들이 합성으로 만들어진 컨텐츠를 판별해 낼 수 있는 도구도 개발중임.
  • 워터마크 : 컨텐츠 내에 포함되어 이미지를 수정하더라도 계속 유지됨
  • 메타데이터 : 본 파일에 대한 정보를 담고 있으며, 컨텐츠 크리에이터들이 이미지를 보는 어디서든 맥락을 확인할 수 있도록 AI에서 생성된 모든 이미지에 메타데이터가 포함되도록 할 것

"About this Image" 정보를 누르면, 이미지에 대한 정보(처음 생성된 시기, 장소 등)을 제

 

3. 바드(Bard)와 워크스페이스 업데이트

  • 사용자들이 직접 제품 개발에 참여할 수 있음
  • '23년 3월에 출시한 대화형 AI인 바드(Bard)에 PaLM2 모델이 적용되었고, 이제 프로그래밍 기능을 지원하며 추론/수학 등에서 훨씬 더 똑똑한 답변을 한다.
  • 워크스페이스 (Google Workspace)에서도 Duet AI 기능을 통해 슬라이드와 이미지를 생성하고, 위에서 소개한 "Help me write" 기능을 통해 글쓰기를 지원한다.
듀엣 AI (Duet AI) - 구글 워크스페이스에서 프레젠테이션 맞춤형 이미지를 생성할 수 있다. (Google)

 

4. 검색 생성 경험(SGE, Search Generative Experience) on 구글 랩스(Labs)

  • 멀티모달 구글 렌즈(Google Lens)는 이미지와 텍스트를 모두 사용하여 검색하는 멀티서치 구현하여, 이미지를 통해 내용을 텍스트 없이 검색할 수 있도록 제공한다.
  • 생성형 AI 능력을 결합한 검색은 아직 초기 단계이며, 원칙에 따라 개발하며 더 발전시켜 나갈 것
  • 구글 실험실(Labs)에서 새로운 SGE(Search Generative Experience) 기능 체험하기 : 바로가기

 

5. 모든 사용자들이 쉽게 혁신할 수 있도록 지원할 것

  • 많은 사람들이 AI로 쉽고 확장성있게 혁신할 수 있도록 지원할 것
  • TPU와 GPU 등의 첨단 컴퓨팅 인프라를 제공하고, 자체 제품에서 엄격한 테스트를 거친 최신 모델의 접근(Access)를 확대하고 있다.
  • 고객이 기업내에서 안전/보안 및 개인정보보호를 통해 자체 모델을 학습 및 파인튜닝(fine-tuning)하여 실행할 수 있도록 노력하고 있다.
  • 관련된 자세한 내용은 구글 클라우드 CEO (토마스 쿠리안, Thomas Kurian)의 글 참조 : 바로가기

 

그 외 내용

  1. 안드로이드 : 매직 컴포즈 (Magic Compose), 시네마틱 배경화면 (Cinematic Wallpapers), 생성형 AI 배경화면 (Generative AI Wallpaper)등을 제공하여 사용자의 휴대폰을 창의적으로 개인화 할 수 있도록 지원
  2. 스마트홈 기기들 : 픽셀 7A(Pixel 7a), 픽셀 폴드(Pixel Fold), 픽셀 태블릿(Pixel Tablet) 등 AI기반 디바이스 생태계를 제공
  3. 함께 만들어가는 미래 : AI 기술이 우리에게 미칠 영향을 인식하고, 모두에게 유익한 방향으로 발전시킬 수 있도록 Google은 지속적으로 노력할 것. 개발자 커뮤니티가 긍정적인 AI 생태계 조성에 매우 중요한 역할을 할 것.

 

출처 : 순다 피차이(Sundar Pichai)의 2023 구글 I/O 키노트

반응형