Hôm nay, Google đã chính thức công bố Gemini 1.0 – mô hình Al thế hệ tiếp theo của mình. Mô hình này được giới thiệu lần đầu tiên tại I/O 2023 vào tháng 5. Vừa ra mắt, Gemini 1.0 đã được nhận định là một bước tiến lớn trong lĩnh vực trí tuệ nhân tạo có tiềm năng thay đổi cách chúng ta tương tác với máy tính và các thiết bị điện tử khác.
Vậy bây giờ hãy cùng Điện thoại Giá Kho tìm hiểu chi tiết hơn về Gemini 1.0 qua bài viết sau đây nhé!
Gemini 1.0 – Mô hình trí tuệ nhân tạo đa phương thức nguyên bản của Google
Gemini là một mô hình ngôn ngữ lớn (LLM) được phát triển bởi Google. Nó được mệnh danh là “mô hình tổng quát có năng lực nhất” và có thể “hiểu, vận hành và kết hợp” văn bản, mã, âm thanh, hình ảnh và video. Được cho là mô hình đa phương thức nguyên bản, nghĩa là nó được đào tạo trên một tập dữ liệu khổng lồ gồm các loại dữ liệu khác nhau. Điều này cho phép Gemini hiểu và xử lý các thông tin từ nhiều nguồn, từ các văn bản kỹ thuật đến các hình ảnh.
Cách tiếp cận hiện tại để tạo ra các mô hình đa phương thức bao gồm “đào tạo các thành phần riêng biệt cho các phương thức khác nhau và sau đó ghép chúng lại với nhau”. Cách tiếp cận này có một số ưu điểm, nó cho phép các nhà nghiên cứu tập trung vào việc đào tạo các thành phần tốt nhất cho từng phương thức cụ thể và được sử dụng cho nhiều loại nhiệm vụ khác nhau. Tuy nhiên, cách tiếp cận này cũng có nhược điểm vì nó có thể dẫn đến các mô hình không đồng nhất, trong đó các thành phần khác nhau không thể giao tiếp hiệu quả và có thể khiến các mô hình gặp khó khăn với những lý luận phức tạp và mang tính khái niệm hơn.
Ngoài ra, Gemini còn được đào tạo trên hai thế hệ chip Tensor Processing Unit (TPU) của Google: TPU 4 và TPU v5e. Song hiện tại, mô hình này còn được trang bị chip TPU v5p, đây là chip TPU mạnh mẽ, hiệu quả và có khả năng mở rộng nhất của Google. Nó cung cấp hiệu suất gấp 10 lần so với TPU v5e giúp Gemini đào tạo nhanh hơn và hiệu quả hơn.
Bên canh đó, để thể hiện khả năng “lý luận phức tạp” của mình, Google đã thử nghiệm Gemini phân tích 200.000 tài liệu nghiên cứu khoa học, lọc ra những tài liệu có liên quan và sau đó tóm tắt dữ liệu trong khoảng một giờ. Qua đó, kết quả thử nghiệm này cho thấy Gemini có khả năng thực hiện các nhiệm vụ phức tạp một cách hiệu quả, giúp ứng dụng trong nhiều lĩnh vực khác nhau, chẳng hạn như khoa học, y học, kinh doanh và giáo dục.
Đồng thời, để đáp ứng nhu cầu sử dụng đa dạng, từ các trung tâm dữ liệu đến thiết bị di động, Google còn cung cấp Gemini 1.0 với ba kích cỡ khác nhau, gồm Gemini Ultra, Gemini Pro và Gemini Nano. Trong đó, Gemini Ultra là mô hình lớn nhất và mạnh mẽ nhất, có khả năng hoàn thành nhiệm vụ có độ phức tạp cao.
Điểm chuẩn của Gemini 1.0
Theo kết quả thử nghiệm của Google, Gemini Ultra vượt trội hơn GPT-4 ở các điểm chuẩn dựa trên văn bản để đo lường lý luận, toán học và mã. Cụ thể, Gemini Ultra đạt tỷ lệ 90,0% trong điểm chuẩn MMLU, trong khi GPT-4 đạt 86,4%. Qua đó, cho thấy Gemini Ultra có khả năng hiểu và giải quyết vấn đề tốt hơn GPT-4, ngay cả khi so với các chuyên gia.
Về mặt đa phương thức, Gemini Ultra đánh bại GPT-4V trong các bài kiểm tra hình ảnh, video và âm thanh. Đặc biệt, với các điểm chuẩn hình ảnh đã thử nghiệm, Gemini Ultra còn vượt trội hơn các mẫu máy tiên tiến trước đó mà không cần sự hỗ trợ từ hệ thống nhận dạng ký tự đối tượng (OCR). Các điểm chuẩn này cho thấy Gemini Ultra có khả năng hiểu và kết hợp thông tin từ nhiều nguồn khác nhau một cách hiệu quả mang tiềm năng suy luận và đưa ra quyết định phức tạp hơn so với các mô hình AI khác.
Về mặt an toàn, Gemini được cho là có “các đánh giá an toàn toàn diện nhất so với bất kỳ mô hình AI nào của Google cho đến nay”, với các biện pháp bảo vệ mới được áp dụng để giải quyết các khả năng đa phương thức. Hơn nữa, Google đặc biệt đang nỗ lực để đảm bảo rằng Gemini không tạo ra nội dung thiên vị hoặc độc hại.
Trải nghiệm Gemini Pro qua Bard
Cách đầu tiên để trải nghiệm mô hình nền tảng mới này là thông qua Bard. Hiện phiên bản này của Gemini Pro cung cấp khả năng lập luận, lập kế hoạch, viết nâng cao, hiểu và tóm tắt nội dung. Đặc biệt, hiệu suất của nó đã vượt qua GPT 3.5 (ở sáu trên tám điểm chuẩn, bao gồm MMLU và GSM8K) và cho biết nó sẽ mang lại cải tiến chất lượng lớn nhất cho Bard kể từ khi ra mắt.
Hiện tại, Gemini Pro hiện đã ra mắt bằng tiếng Anh cho 170 quốc gia/ vùng lãnh thổ và dự kiến nó sẽ có sẵn ở Vương quốc Anh và Châu Âu “trong tương lai gần”. Còn Gemini Ultra sẽ ra mắt vào đầu năm sau. Google hiện đang “hoàn thành các cuộc kiểm tra độ tin cậy và an toàn trên diện rộng” cũng như cải tiến mô hình trước khi cung cấp rộng rãi hơn cho các nhà phát triển và khách hàng doanh nghiệp.
Trong đó, Gemini Ultra sẽ có sẵn thông qua ưu đãi “Bard Advanced” mới. Ưu đãi này sẽ cung cấp quyền truy cập sớm vào các mô hình và khả năng tiên tiến nhất của Google, như Gemini Ultra.
Trên đây là những thông tin mới nhất về Google công bố Gemini 1.0 do Điện thoại Giá Kho thu thập được. Nếu bạn thích những bài viết về tin tức như trên thì hãy tiếp tục truy cập trang Tin Công Nghệ để xem thêm nhiều thông tin hay và bổ ích hơn nhé!
Nguồn tin: 9to5google
Đọc thêm: Bạn có thể đặt câu hỏi về video Youtube cho Bard AI của Google
Địa chỉ showroom của Điện thoại Giá Kho tại TP. HCM
121 Chu Văn An, P26, Quận Bình Thạnh, HCM
1247, Đường 3 Tháng 2, P7, Quận 11, HCM
947 Quang Trung, P14, Quận Gò Vấp, HCM
56 Lê Văn Việt, Phường Hiệp Phú, TP. Thủ Đức