Google giới thiệu Gemma 3: AI cực nhẹ, cho hiệu suất vượt trội trên 1 GPU

Mới đây, Google đã giới thiệu một tập hợp các mô hình AI mã nguồn mở tân tiến nhất có tên là Gemma 3 - được thiết kế tối ưu để chạy nhanh trên cấu hình từ điện thoại đến máy tính chỉ có một GPU hoặc một TPU duy nhất.
Gemma 3 nổi bật với hiệu năng vượt trội so với kích thước của bản thân mô hình này, với khả năng xử lý ngữ cảnh mở rộng lên đến 128k token, hỗ trợ đa ngôn ngữ với hơn 140 ngôn ngữ, cũng như tính năng gọi hàm tự động giúp tối ưu hóa quy trình làm việc, đồng thời có các phiên bản "lượng tử hóa" giúp giảm kích thước mô hình mà vẫn duy trì độ chính xác cao.
Google đã xây dựng mô hình Gemma làm nền tảng cốt lõi cho cam kết của họ trong việc mang công nghệ AI hữu ích đến gần hơn với người dùng trên toàn cầu. Tháng trước, Google DeepMind đã ăn mừng khi Gemma đạt hơn 100 triệu lượt tải xuống và một cộng đồng sôi động đã tạo ra hơn 60,000 biến thể Gemma.
Vào ngày 13/3, Google giới thiệu Gemma 3 – bộ mô hình AI mở nhẹ, tiên tiến được phát triển trên cùng công nghệ đã hỗ trợ các mô hình Gemini 2.0, nhằm chạy nhanh trực tiếp trên các thiết bị từ điện thoại đến máy trạm. Gemma 3 có nhiều kích cỡ (1B, 4B, 12B, 27B), cho phép các nhà phát triển lựa chọn mô hình phù hợp nhất với phần cứng và nhu cầu hiệu năng của họ.
Gemma 3 cung cấp nhiều khả năng mới, như chạy trên cấu hình một GPU hoặc TPU duy nhất, hỗ trợ nhiều ngôn ngữ với hơn 140 ngôn ngữ được huấn luyện sẵn, và khả năng phân tích hình ảnh, văn bản cùng video ngắn. Ngoài ra, Gemma 3 còn cho phép xử lý thông tin với cửa sổ ngữ cảnh lên đến 128k token và hỗ trợ gọi hàm để tự động hóa các quy trình làm việc. Google cũng giới thiệu phiên bản lượng tử hóa của Gemma 3, giúp giảm kích thước mô hình và yêu cầu tính toán mà vẫn duy trì độ chính xác cao.
Google đã thiết lập các quy trình an toàn nghiêm ngặt trong quá trình phát triển Gemma 3, đảm bảo quản lý dữ liệu và đánh giá rủi ro một cách cẩn thận. Song song với đó, Google cũng ra mắt ShieldGemma 2 – công cụ kiểm tra an toàn hình ảnh mạnh mẽ, cung cấp nhãn an toàn cho các nội dung nguy hiểm, khiêu dâm và bạo lực, và có thể được tùy chỉnh theo nhu cầu của các nhà phát triển và người dùng.
Gemma 3 và ShieldGemma 2 tích hợp liền mạch với các công cụ như Hugging Face Transformers, Ollama, JAX, Keras, PyTorch và Google AI Edge, cho phép các nhà phát triển thử nghiệm, giúp họ tùy chỉnh và triển khai mô hình dễ dàng trên nhiều nền tảng phần cứng, từ GPU NVIDIA, TPU của Google đến GPU AMD qua ROCm.
Với Gemma 3, Google khẳng định rằng hãng cam kết mở rộng sự tiếp cận AI công nghệ cao cho tất cả mọi người và truyền cảm hứng cho sự đổi mới sáng tạo trên toàn cầu. Các nhà phát triển có thể bắt đầu khám phá Gemma 3 ngay hôm nay qua Google AI Studio để trải nghiệm sức mạnh của AI một cách trực tiếp và dễ dàng.
Nguồn: Bloggoogle
Xem thêm:
- Manus AI ra mắt tại Trung Quốc, thách thức GPT và DeepSeek
- OpenAI ra mắt mô hình GPT-4.5 mới cho ChatGPT với nhiều cải tiến ấn tượng
Xin mời độc giả tham khảo qua Danh sách Laptop đang được quan tâm nhiều tại CellphoneS, với hiệu năng trên giá thành tốt, chắc chắn sẽ giúp bạn sử dụng AI để làm việc hiệu quả hơn.
Danh sách Laptop đang được quan tâm nhiều tại CellphoneS
Xem tất cả