Cuộc chiến đồ hoạ giữa NVIDIA và AMD vẫn thường gây ra không ít khói lửa trên các diễn đàn công nghệ. Sau khi AMD ra mắt dòng card HD 7000 dựa trên kiến trúc GCN mới, người ta bắt đầu hỏi NVIDIA sẽ phản pháo như thế nào ? Câu trả lời có lẽ sẽ đến vào cuối tháng 3 này với ẩn số GTX 680.
Cho đến lúc này, mọi thông tin về GTX 680 vẫn chưa thực sự rõ ràng. Nhưng rất nhiều nguồn tin cùng đồng thuận với nhau rằng chiếc card mới của NVIDIA sẽ dựa trên chip GK104 (GK tức GeForce Kepler), vốn áp dụng kiến trúc Kepler mới so với kiến trúc Fermi hiện đang được dùng cho dòng card GeForce 400 & 500 của hãng này
Trong khuôn khổ bài phân tích này, chúng ta sẽ bình luận đôi nét về chiếc card mới của NVIDIA trước giờ "G". Hình ảnh trong bài viết do HKEPC cung cấp.
Đôi nét về kiến trúc
Nhưng trước khi đi sâu vào vấn đề, tôi sẽ nêu lý do vì sao chọn các thông tin từ HKEPC mà không phải site khác. Vì site này có các tài liệu "rất nhiều khả năng" do chính NVIDIA cung cấp. Do vậy mà độ tin cậy nhiều hơn các site khác. Dĩ nhiên, bạn hoàn toàn có quyền nghi ngờ vì trong thế giới phẳng này, mọi thứ đều có khả năng là "hàng dựng".
Vậy tài liệu của HKEPC có gì hay ? Chúng cho chúng ta thấy được cơ bản về con chip sắp ra mắt của NVDIA - GK104. Bạn cần chú ý rằng Kepler là một kiến trúc và nó sẽ được áp dụng cho rất nhiều sản phẩm. GK104 chỉ là model đầu tiên được giới thiệu nên sau này có thể sẽ có nhiều khác biệt với các chip khác. Như trường hợp của GTX 460 / 560 (GF104 / GF114) và GTX 480 / 580 (GF100 / GF110) là một ví dụ. Tuy cùng là kiến trúc Fermi nhưng cấu tạo SM của GF114 (48 nhân CUDA) khác với SM của GF110 (32 nhân CUDA). Hai con chip Fermi này còn khác nhau ở lượng đơn vị Dispatch (gửi lệnh) và TMU tính trên từng SM.
SM Fermi 1.0.
SM Fermi 2.0.
Còn giữa Fermi và Kepler, nếu thoáng nhìn bạn sẽ không thấy nhiều khác biệt. Đặc biệt ở hình dạng die chip, cả hai đều có L2 Cache nằm ở giữa và 4 khối xử lý nằm ở 4 góc die chip.
Die chip GF114.
Die chip GK104.
Nhưng nói thế không có nghĩa Kepler không có gì mới. Mặc dù bạn có thể nói Kepler là bản cải tiến của Fermi. Có điều, đến với Kepler, NVIDIA có chút thay đổi : SM từ nay có tên mới là SMX. Ý nghĩa ? Từ một bộ xử lý đa luồng (stream multi-processor) thành nhiều bộ xử lý đa luồng (stream multi-processorS) : X ở đây là số nhiều (s). Và bạn có thể xem hình sau để hình dung về SMX :
Nếu bạn quay lên trên một chút và nhìn lại SM của GF114, bạn có nhận thấy gì không ? Hãy để tôi làm sơ kết nhỏ sau nhé :
- SM GF114 : 48 nhân CUDA, 8 SFU, 4 Dispatch Unit, Register File 32 KB, L1 Cache 64 KB, 8 TMU, 1 PolyMorph Engine 1.0
- SMX GK104 : 192 (48 x 4) nhân CUDA, 32 SFU (8 x 4), 8 Dispatch Unit (4 x 2), Register File 64 KB (32 x 2), L1 Cache 64 KB (không đổi), 16 TMU (8 x 2), 1 PolyMorph Engine 2.0
Như vậy có thể thấy, SMX về cơ bản là trò "khắc nhập khắc nhập" của nhiều SM. Lượng "khắc nhập" này tuỳ theo tính quan trọng của nó sẽ nhiều hay ít. Ở đây, số nhân đồ hoạ (nhân CUDA hay nhân shader hay gọi tắt là SP) được NVIDIA đặt lên hàng đầu. Kết quả là từ một con chip Fermi GF114 có 384 SP, con chip Kepler GK104 có đến tận … 1536 SP (!), tức gấp 4 lần GTX 560 Ti hoặc 3 lần GTX 580 - model đơn chip mạnh nhất hiện nay của NVIDIA.
Tuy vậy, số nhân đồ hoạ nhiều như thế có đồng nghĩa với hiệu năng tăng gấp 4 lần GTX 560 Ti hay 3 lần GTX 580 không ? Chúng ta sẽ đọc tiếp ở phần sau.
Sơ bộ về thông số kỹ thuật
Mặc dù GTX 680 (GK104) trông có vẻ là phiên bản "nhồi thịt" của GTX 560 Ti (GF114), song nhiều người "thích" so sánh nó với GTX 580 (GF110) hơn. Một phần cũng dễ hiểu vì GTX 680 nghe "khớp" hơn về mặt thương hiệu so với GTX 580. Ngoài ra GTX 580 là model đơn chip mạnh nhất hiện nay của NVIDIA. Giới công nghệ rất háo hức muốn biết xem liệu chiếc card mới của NVIDIA có thể vượt qua đàn anh của nó hay không (sau đấy mới nói được liệu nó có hơn HD 7970 của AMD không). Chúng ta có bảng so sánh sau :
GK104 sẽ dùng chung tiến trình bán dẫn 28nm như Tahiti của AMD. Song GK104 có ít transistor : 3,54 vs. 4,31 tỷ và vì thế kích thước die cũng nhỏ hơn : 294 vs. 365 mm2. Bạn có thể bảo rằng không công bằng cho lắm khi "đòi" con chip ít transi hơn "phải" mạnh hơn con chip nhiều trans hơn. Tuy vậy ở đây chúng ta có sự khác biệt về kiến trúc. Nếu chỉ tính "nội bộ gia đình" giữa Fermi và Kepler, thì GTX 580 "chỉ có" 512 SP nhưng cần tới 3 tỷ trans, còn GTX 680 "lại đến" 1536 SP mà chỉ dùng có 3,54 tỷ trans. Có vẻ như SP Kepler khác biệt (nhỏ hơn) rất nhiều so với SP Fermi.
Thông số bộ nhớ cũng là một yếu tố cần quan tâm. Tuy GTX 680 có giao tiếp nhớ chỉ 256-bit, song xung chip DRAM được đẩy lên mức 6 GHz, nên năng lực băng thông nhớ về căn bản của chiếc card Kepler không khác so với GTX 580 : đều ở mức 192 GB/s. Lượng TMU nhiều gấp đôi so với đàn anh Fermi cùng dung lượng nhớ 2 GB về lý thuyết sẽ giúp GTX 680 vượt hơn GTX 580 khi chơi game ở các độ phân giải cao.
Nhưng lý thuyết là lý thuyết, cứ phải benchmark mới rõ mọi chuyện như nào. Dưới đây là cấu hình mà HKEPC đã dùng để kiểm định.
Các benchmark đầu tiên
Trong trường hợp muốn tham khảo kỹ hơn, bài so sánh giữa HD 7900 và GTX 580 trước đây sẽ giúp bạn hiểu rõ hơn vấn đề.
3DMark 11
Bạn chỉ cần chú ý phần GPU Score. Ở thiết lập Extreme, GTX 680 nhanh hơn GTX 580 đến 50% và hơn HD 7970 tới 18%. Còn ở Performance, hai con số này lần lượt là 54% và 25%. Rõ ràng chiếc card mới của NVIDIA mạnh hơn của AMD. Song khi so với GTX 580, bạn đừng quên GTX 680 chạy ở xung 1 GHz.
Batman Arkham City
Chiếc card Kepler nhanh hơn card Fermi 35% và vượt card GCN 16%. Có vẻ hiệu năng lý thuyết (dựa trên 3DMark) không giống lắm so với thực tế (chơi game).
Battlefield 3
Lần này có ngạc nhiên vì GTX 680 vẫn nhanh hơn đáng kể GTX 580 (33%), nhưng gần như chả hơn được HD 7970 là mấy (2%).
Heaven Benchmark
Một phép thử tương đối "lý thuyết" như 3DMark nhưng chủ yếu về hiệu năng Tessellation (DirectX 11). Kết quả gần tương tự như phép thử Batman : hơn GTX 580 33% và HD 7970 12%.
Lost Planet 2
Game này được biết như một trò "thiên vị" NVIDIA. Nên không ngạc nhiên khi GTX 580 ~ HD 7970 còn GTX 680 hơn đàn anh tới 34%.
Modern Warfare 3
Đừng để đồ thị đánh lừa mắt bạn (mốc thấp nhất là 62 fps). Thực tế chênh lệch chỉ có 10% !
Tiêu thụ điện - Nhiệt độ
Với ít transistor hơn còn xung hoạt động gần ngang nhau, việc GTX 680 ngốn ít điện hơn HD 7970 là dễ hiểu. Cũng vì thế mà lượng nhiệt toả ra (do đốt điện) cũng ít hơn. Dường như câu trả lời cho HD 7970 và GTX 680, ai hơn ai, đã rõ.
Nhiều nhân đồ hoạ hơn có thực sự mạnh hơn ?
Với nhiều người, mọi thứ có vẻ đã ngã ngũ trong cuộc đấu giữa HD 7970 và GTX 680. Tuy vậy nếu bạn quan sát kỹ hơn và thực sự quan tâm nhiều hơn về chủ đề đồ hoạ, bạn sẽ thấy có một điểm dễ khiến nhiều người hiểu lầm : lượng SP của Kepler không tỷ lệ với hiệu năng như Fermi. Về lý thuyết GK104 (Kepler) có số SP gấp 4 lần GF114 (Fermi), song hiệu năng thực tế chỉ gấp đôi (giả sử rằng hai con chip hoạt động ở cùng xung).
Lại nói vấn đề xung, bạn thấy rõ GTX 580 chỉ chạy ở mức 772 MHz, còn GTX 680 là 1006 MHz. Tức khoảng cách về xung là 30%. Thực tế benchmark cho thấy GTX 680 mạnh hơn GTX 580 đúng ngần này ! Còn một chi tiết về Kepler mà tôi chưa nêu : NVIDIA bổ sung một tính năng mới cho chiếc card của mình : GPU Boost. Về căn bản, GPU Boost khá giống Turbo Boost / Turbo CORE mà Intel / AMD đang áp dụng cho CPU. Tính năng này sẽ giúp GPU khai thác hết mức TDP "thừa" trong trường hợp chiếc card không chạy ở 100%. Được biết mức xung boost của GTX 680 là 1058 MHz, tức hơn 772 MHz của GTX 580 tới 37%.
Những khúc mắt có lẽ đến khi NVIDIA chính thức giới thiệu GTX 680 mới được giải đáp. Dù vậy, bạn hãy lên tinh thần rằng chiếc card nhiều nhân hơn chưa hẳn sẽ mạnh hơn, trong trường hợp những cái nhân ấy khác biệt về mặt kiến trúc ...