Trang 4 của 4 Đầu tiênĐầu tiên ... 234
Kết quả 31 đến 34 của 34
  1. #31
    Ngày tham gia
    Apr 2016
    Bài viết
    111
    Trích dẫn Gửi bởi Rockie
    Có lẽ bro lầm rồi ,Shader clock ko giúp cho G80 có tốc độ xử lý floating-point operation tương đương với R600 ( vì shader clock của R600 là 1600Mhz ). Tuy nhiên số lượng ALU của G80 nhiều hơn của R600 ( 128 so với 64 ).
    Tôi cũng chẳng rõ là ALU của R600 có phải đúng là 64 hay ko và G80 có phải là 128 hay ko, đó ko phải là cái tôi bận tâm.

    Như mọi người đã biết 8800GTX có 128 SP, vậy cái tốc độ xung của SP 1350MHz (và xung SP của 8800GTS là 1200MHz) đóng vai trò gì trong tính toán dấu chấm động ở đây, hãy xem qua cái bảng sau đây




    Huh?

    Vec4 (MADD+ADD) = 12 FLOPs
    Scalar (MADD+ADD) = 3 FLOPs
    -----------------------------------
    15 FLOPs

    ....oder

    Vec4 MADD = 8 FLOPs
    Scalar MADD+ADD = 3 FLOPs
    ----------------------------------
    11 FLOPs

    Das einzige was eine gerade Zahl ergibt waere:

    Vec4 MADD = 8 FLOPs
    Scalar MADD = 2 FLOPs
    ----------------------------------
    10 FLOPs

    (wobei man noch ADD zur Vec4 ALU dazuschieben kann, dann werden es halt 12).
    http://www.forum-3dcenter.org/vbulletin/showthread.php?t=350597&page=3


    http://www.behardware.com/articles/644-3/nvidia-geforce-8800-gtx-8800-gts.html

    Có thể thấy 8800GTX khả năng tính toán dấu chấm động là 518,4GFLOPs, làm sao để ra con số này nó chính là

    1,35GHz (1350MHz) * 128 SP * Calculation units (1)

    đối với G80 Calculation units thuộc loại MAD + MUL, ngoài ra 128 SP của 8800GTX thuộc loại bộ xử lý vô hướng scalar

    Xem lại bảng phía trên Scalar(MAD + MUL) = Scalar MADD+ADD =
    Scalar MADD + Scalar ADD = 2 FLOPs + 1 FLOPs = 3 FLOPs

    Vậy ráp vào công thức (1) ta sẽ có

    1,35GHz * 128 SP * 3 FLOPs = 518,4 GFLOPs

    Cũng tương tự như vậy có thể tính ra 8800 GTS là

    1,2GHz (1200MHz) * 96 SP * 3 FLOPs = 345,6 GFLOPs

    Bằng cách áp dụng công thức trên cũng dễ dàng tính ra của X1950XTX, 7900GTX, nhưng chú ý rằng.

    Calculation units của X1950XTX thuộc loại vectơ ADD+MADD = Vec4 (MADD+ADD) = Vec4 MADD+ Vec4 ADD = 8 FLOPs + 4 FLOPs = 12 FLOPs

    Và Calculation units của 7900GTX cũng thuộc loại vectơ nhưng là MAD+MAD = Vec4 (MADD+MADD) = Vec4 MADD+ Vec4 MADD = 8 FLOPs + 8 FLOPs = 16 FLOPs

    Vậy còn cái nhân vật chính R600, cứ tạm gọi là bộ xử lý tô bóng thống nhất thuộc loại gì




    64 Shader pipelines (Vec4+Scalar)
    32 TMU's
    32 ROPs
    128 Shader Operations per Cycle
    800MHz Core
    102.4 billion shader ops/sec
    512GFLOPs for the shaders
    http://www.megagames.com/news/html/hardware/atir600specsrevealed.shtml

    Đây là thông tin về thông số kỹ thuật của R600 thực ra là thông tin rất cũ, nhưng căn cứ vào những hình ảnh mà hardocp đã đưa gần đây tôi nhận thấy là chính xác ở khả năng tính toán dấu chấm động của R600.

    Nếu đúng thông tin mà chúng ta đã biết SP của R600 (cứ tạm gọi như vậy) thuộc loại vừa vô hướng (scalar) vừa có hướng (Vec4)

    Vậy Calculation units của R600 có thể là
    Vec4 MADD = 8 FLOPs
    Scalar MADD = 2 FLOPs
    ----------------------------------
    10 FLOPs

    Áp vào công thức ta có

    0,8GHz (800Mhz) * 64 * 10 FLOPs = 512GFLOPs.

    Chỉ qua ví dụ trên có thể thấy tới dòng card DX10 của ATI và nVIDIA ko thể căn cứ vào số lượng SP để phán thằng nào mạnh hơn thằng nào cả, vì kiến trúc của 2 bên đã đi theo 2 hướng khác hẳn nhau.

    Theo những thống tin tôi đã thu thập trên các 4rum hardware trên thế giới R600 rất có thể sẽ được ATI đẩy lên 80 SP (tạm gọi như vậy cho gọn) tức là cao hơn phiên bản cũ 25%, nhưng có thể nVIDIA sẽ phản đòn 1 cách đơn giản với phiên bản 8800 Ultra với clock của SP được đẩy lên hơn 25% (khoảng 1700Mhz chẳng hạn).

    Còn phiên bản 8900GTX thì có thể lại được trang bị đến 160 SP. Đến lúc đó ATI chắc chắn phải nghĩ đến biện pháp đối phó. Cứ chờ sẽ rõ.




    shader clock của R600 là 1600Mhz
    Tôi chưa hề nghe cũng như đọc thấy thông tin này trên tất cả những 4rum hardware mà tôi biết.

  2. #32
    Ngày tham gia
    Aug 2015
    Bài viết
    3
    Tôi chưa hề nghe cũng như đọc thấy thông tin này trên tất cả những 4rum hardware mà tôi biết

    64 Shader pipelines (Vec4+Scalar)
    32 TMU's
    32 ROPs
    128 Shader Operations per Cycle
    800MHz Core
    102.4 billion shader ops/sec
    512GFLOPs for the shaders
    Số lượng SP của R600 là 64 ,hiệu suất tính toán của trong quá trình shader là 102.4 bil shader ops/s ,nếu chia cho 64 thì sẽ có shader clock là 1600 MHz đơn giản thế thôi bro à

  3. #33
    Ngày tham gia
    Mar 2016
    Bài viết
    0
    Trích dẫn Gửi bởi Rockie
    Số lượng SP của R600 là 64 ,hiệu suất tính toán của trong quá trình shader là 102.4 bil shader ops/s ,nếu chia cho 64 thì sẽ có shader clock là 1600 MHz đơn giản thế thôi bro à
    Công thức bro áp dụng là đúng nhưng bro đã quên cái này



    128 Shader Operations per Cycle
    Tức là Shader Operations trong mỗi Cycle nhiều gấp đôi số SP của R600 là 64, nên chung qui lại xung của shader clock vẫn chỉ là 800MHz, bây giờ tôi đã hiểu là tại sao vấn đề vốn rất đơn giản như vậy mà tôi lại ko tìm thấy trên bất cứ diễn đàn hardware mà tôi biết.

  4. #34
    Ngày tham gia
    Aug 2015
    Bài viết
    4
    nvidia và ati wa này xem ai thắng

Quyền viết bài

  • Bạn Không thể gửi Chủ đề mới
  • Bạn Không thể Gửi trả lời
  • Bạn Không thể Gửi file đính kèm
  • Bạn Không thể Sửa bài viết của mình
  •