Gemini 1.5 Pro – Khởi đầu cho cuộc đua không hồi kết

June 16, 2024 nguyentranngoctram289

*Một số nội dung trong bài này được viết dựa trên quan điểm cá nhân của dân không chuyên (It’s me)

Lĩnh vực Generative AI (AI tạo sinh) đang là một trong những lĩnh vực đang phát triển không ngừng, những công ty khởi nghiệp và nhà nghiên cứu khoa học đang ráo riết chạy đua với nhau về công nghệ, tính năng đính kèm, và những cột mốc bứt phá mới. Từ trước đến nay, ChatGPT như ông hoàng không ngai vì khả năng đa tác vụ như lên kế hoạch, sáng tạo nội dung, nghiên cứu tìm kiếm, phân tích dữ liệu, viết code,.v.v. Tuy nhiên, Chan nghĩ cuộc chơi thật sự của các Nhà phát triển AI đã chính thức được “lên ga” khi Google ra mắt Gemini 1.5 Pro.

Các mô hình ngôn ngữ lớn ( LLMs ) là yếu tố cốt lõi của Generative AI vì LLM là nền tảng để xây dựng các dịch vụ và ứng dụng. OpenAI đã giúp khởi đầu kỷ nguyên LLM hiện đại với các phiên bản GPT, trong đó GPT4o là phiên bản mới nhất. Không giống như các phiên bản trước chủ yếu dựa vào văn bản, chương trình đào tạo của GPT4o kết hợp nhiều phương thức bao gồm văn bản, hình ảnh và cả âm thanh. Và nếu so sánh trực quan về từng khả năng của các chatbotAI trên thị trường hiện nay, ChatGPT vẫn đang duy trì vị thế của mình.

Mô hình ChatGPT được xây dựng bằng cách sử dụng một biến thể của cấu trúc Transformer, bao gồm một khung mã hóa-giải mã với các cơ chế tự chú ý. Mô hình được đào tạo theo cách có giám sát, và sử dụng tập dữ liệu lớn gồm các ví dụ đầu vào đầu ra được ghép nối. Trong quá trình đào tạo, mô hình học cách dự đoán mã thông báo tiếp theo có khả năng xảy ra nhất theo trình tự dựa trên bối cảnh trước đó. Điều này được thực hiện bằng cách giảm thiểu hàm tổn thất (loss function), điển hình là tổn thất entropy chéo, giữa phân bố dự đoán và phân phối mục tiêu thực tế. Tuy nhiên cũng chính vì cấu trúc này mà OpenAI phải chấp nhận một khuyết điểm tương đối lớn đó chính là thiếu hàm tổn thất sẽ khiến AI khó xác định thế nào là một câu trả lời tốt hay không, việc chọn đúng hàm tổn thất sẽ quyết định mức độ ổn định của công cụ ước tính. Cũng chính vì vậy, Chan nghĩ giao diện khung chat của ChatGPT luôn có phần đánh giá câu trả lời, và cách training Flase/True của team đào tạo phía OpenAI là hai trong những cách mà NPT (nhà phát triển) nghĩ ra để khắc phục phần nào lỗi này.

Đợt nghỉ Tết 2024 Chan có nhận một job freelancer về AI Model Training, đúng kiểu nhờ đợt đó mà khi đọc “Sóng thần công nghệ” Chan có một sự đồng tình rất cao với những ý kiến mà tác giả đưa ra. Bắt đầu cũng tìm hiểu nhiều về các kiểu train model AI mà các bên đang triển khai. Với Chan, train AI cũng như dạy con người vậy, nó sẽ thể hiện những thứ mình đã train cho nó, bao gồm cả thứ không tốt.

Vậy thì trước khi Gemini 1.5 Pro xuất hiện, ai có khả năng đe dọa vị trí Top 1 của ChatGPT?

Đáp án nằm ngay ở bảng thống kê trên, đó chính là Claude.
Thoạt nhìn nếu so sánh tất cả số liệu, Claude vẫn kém hơn ChatGPT và vẫn còn một số chức năng chưa hỗ trợ như voice, tạo hình ảnh,.. Nhưng nhờ vào hệ thống đào tạo khép kín, có chọn lọc kỹ càng và theo nguyên tắc nhân đạo dựa trên “constitutional AI” (Hiến pháp AI) mà chị em nhà Amodei, Dario and Daniela – CEO & Chủ tịch của Anthropic đang theo đuổi, Claude thật sự mang lại trải nghiệm tuyệt vời cho người dùng bằng văn phong tự nhiên, dễ hiểu, và câu trả lời có trọng tâm nhất định, phù hợp cho những ai cần phân tích chuyên sâu trong mảng tài chính, công nghệ, code,…

Ngoài ra, Claude càng nâng cấp, càng xứng danh với cái tên mà NPT đã dùng để mô tả nó “AI thông minh nhất”

Gemini 1.5 Pro gia nhập cuộc chơi, đảo ngược thế cờ

Cá nhân Chan bị ảnh hưởng khá nhiều do đọc cuốn Sóng Thần Công Nghệ được viết bởi Mustafa Suleyman – đồng sáng lập DeepMind (Gemini, Google AI) và Inflection (Pi) và hiện đang là EVP và CEO của Microsoft AI, nên khá tin vào khả năng của Gemini.
*Tiện đây giới thiệu mọi người Github Gemini: Link

Gemini 1.5 Pro sử dụng mô hình đào tạo mixture-of-experts (MoE), điều này có nghĩa là Google đã chọn MoE như một biện pháp để giải quyết khuyết điểm của Anthropic là kho dữ liệu hạn chế do tính chọn lọc cao, và điểm yếu của ChatGPT là kho dữ liệu tổng hợp lớn nhưng không chọn lọc. Về cơ bản, MoE khác biệt với Deep learning và Transformer truyền thống ở chỗ hệ thống sẽ có cơ chế định tuyến động, kích hoạt có chọn lọc các tập hợp tham số khác nhau (được gọi là “chuyên gia”) tùy thuộc vào dữ liệu đầu vào. Hệ thống sẽ học cách chỉ kích hoạt có chọn lọc các lộ trình chuyên gia phù hợp nhất trong mạng lưới thần kinh của mình để có được các kết quả đầu ra phù hợp với ngữ cảnh. Cùng với đó, nhờ vào dữ liệu khổng lồ của “nhà mẹ” Google, và khả năng truy cập Internet thời gian thực, đã khiến Gemini 1.5 pro nổi bật hơn hẳn trên bảng xếp hạng AI, so với phiên bản cũ là Bard.

Dù khả năng còn nhiều hạn chế so với Claude và ChatGPT nhưng với Chan, dữ liệu real-time là lợi thế sẽ đưa Gemini Pro 1.5 bứt phá cực nhanh, giống kiểu sinh ra ở vạch đích :)). Generative AI quan sát các sự kiện trước đó và học hỏi từ chúng để dự đoán các sự kiện trong tương lai, trong đó sự kiện chính là dữ liệu. Data real-time tức là có nhiều dữ liệu hơn, nhiều tài nguyên hơn để học hỏi, điều này sẽ giúp AI tăng khả năng dự đoán các sự kiện tương lai gần – là điều mà nhiều người vốn vẫn đang phớt lờ nguy cơ công nghệ vì tự tin là AI không bao giờ thay thế được con người do không có khả năng tiên đoán.

Sự ra đời của AI ứng dụng MoE sẽ là chương tiếp của “Sóng thần công nghệ” nơi mà tất cả thay phiên trở thành phiên bản tốt hơn của nhau. Những kiến thức trước đó vốn đang rời rạc sẽ liên kết lại để tạo nên nhiều công thức mới, quan trọng là mix&match như thế nào thôi. Và Chan nghĩ, thư viện Custom GPTs đang đứng trước mối đe dọa lớn chưa từng có, đó là hệ sinh thái Workspace của Google với hơn 3 tỷ người dùng và matching với Gemini khá ổn định. Gemini Pro 1.5 là AI sẽ ứng dụng nhiều trong đời sống thường hơn bất kì AI nào trước đây, không chỉ dừng lại ở việc sáng tạo, đề xuất,.. mà nó sẽ ảnh hưởng trực tiếp đến năng suất làm việc của con người.

Hết bài rồi nè ^^
Đọc thêm một bài khác về AI mình từng viết Xu hướng AI chuyển ảnh thành Animation

Chan Chan Home

Chan Chan Home

Gemini 1.5 Pro – Khởi đầu cho cuộc đua không hồi kết

Leave a Reply Cancel reply