
Çoklu GPU Ölçeklendirmesi: 1 ile 2 GPU Render Hızınızı Gerçekte Ne Kadar Etkiler? (2026 Benchmark)
Genel bakış
Giriş
İkinci bir GPU, render'ı iki kat hızlandırmaz. Bu, söylendiğinde açık görünür; ancak pek çok donanım kararı, iki kartın iki kat hız anlamına geldiği varsayımıyla alınmaktadır. Haziran 2026'da kuyruktan iki benchmark node'unu ayırdık — biri iki RTX 5090'lı, diğeri iki RTX 4090'lı — ve dört render motoru ile yedi sahne/benchmark kombinasyonunda bir kartten iki karta geçildiğinde gerçekte ne olduğunu ölçtük.
Kısa özet: her şey motora bağlıdır. Aktarım hızı odaklı benchmark'lar (V-Ray, Octane) neredeyse mükemmel biçimde, yaklaşık 2× oranında ölçeklendi. Render süresi odaklı motorlar (Cycles, Redshift) daha düşük kaldı; daha hızlı kartta ise ikinci GPU daha az, daha fazla değil, katkı sağladı. Sayılara bakacağız, eğrinin bu şekilde bükülmesinin nedenini açıklayacağız ve — en az bunun kadar önemli şekilde — bu noktada neyin durduğunu net biçimde ortaya koyacağız. Tek bir node'da iki kart, tavanı oluşturmaktadır. Bunun ötesine geçmek, bu mimarinin daha büyük bir versiyonu değil, bambaşka bir mimaridir.
Bu bir donanım/benchmark yazısı olduğu için GPU ağırlıklı bir içerik sunmaktadır. Farm'ımızda çalışan işlerin büyük çoğunluğunun hâlâ CPU rendering (V-Ray, Corona, Arnold CPU üzerinde) olduğunu baştan belirtmek gerekir. Ancak biri "ikinci GPU değer mi?" diye sorduğunda, sürüm konuşması değil, ölçülmüş sayılar hak edilir. İşte ölçülmüş sayılar.
Nasıl Test Ettik (ve Bu Sayılar Ne Değil)
Her iki test node'u da Windows 11 Pro ile çalıştı ve her birinde iki GPU bulunuyordu. 5090 node'u 596.36 sürücüsünü, 4090 node'u ise 610.62 sürücüsünü kullandı — Blackwell kartı daha yeni bir sürücü gerektirir; bu nedenle tam eşleşme mümkün olmadı. Bu sürücü farkının önemi yalnızca şu noktada ortaya çıkar: 5090 ile 4090 arasındaki nesiller arası mutlak hız karşılaştırması. Odaklandığımız ölçeklendirme oranları tek bir node içinde (aynı kart, aynı sürücü, bir GPU'ya karşı iki GPU) ölçülmüştür; bu nedenle sürücü farkı bu oranları etkilemez.
Her sahne bir satıcı standardı benchmark'tır — Blender'ın Open Data sahneleri (bmw27, classroom, junkshop), Redshift için Maxon'ın "Vultures" sahnesi, Chaos V-Ray Benchmark 6.00.02 ve OctaneBench 2025.2.1. Müşteri projeleri veya prodüksiyon dosyaları kullanılmadı. Kare başına süre, kare başına dolar veya elektrik rakamlarını yayımlamıyoruz; çünkü bu veri seti bunları içermiyor ve biz onları uydurmuyoruz.
Cycles satırlarını nasıl okumanız gerektiğini etkileyen önemli bir yöntem notu: Blender Cycles'ı %200 çözünürlükte çalıştırdık — bu, Open Data varsayılanından daha ağır bir yüktür. Amaç, her render'ın stabil ve güvenilir bir ölçeklendirme oranı üretecek kadar uzun sürmesini sağlamaktır. Bu, ham Cycles sürelerimizin kamuya açık Open Data puanlarıyla karşılaştırılamaz olduğu anlamına gelir — bunlar liderlik tablosu için değil, ölçeklendirmeyi ölçmek amacıyla ayarlanmıştır. Cycles ve Redshift render süresiyle (saniye, düşük olan daha iyidir); V-Ray ve Octane ise benchmark puanıyla (vpaths veya OctaneBench puanı, yüksek olan daha iyidir) ölçülmüştür. Bu iki farklı metrik türüdür; bu nedenle mutlak sayılar motorlar arasında hiçbir zaman karşılaştırılmaz — yalnızca bir motor içindeki ölçeklendirme oranı elma ile elma karşılaştırmasıdır.
Temel Sonuç: Motor Başına 1×'den 2×'e Ölçeklendirme
İkinci bir özdeş kartın motor ve sahne bazında gerçekte ne sağladığını gösteren temel veri:
| Motor | Sahne | 2× RTX 5090 ölçeklendirmesi | 2× RTX 4090 ölçeklendirmesi |
|---|---|---|---|
| Cycles | bmw27 | 1,54× | 1,58× |
| Cycles | classroom | 1,59× | 1,63× |
| Cycles | junkshop | 1,31× | 1,38× |
| Redshift | Vultures | 1,68× | 1,92× |
| V-Ray GPU (CUDA) | benchmark | 1,97× | 2,00× |
| V-Ray GPU (RTX) | benchmark | 2,00× | 2,00× |
| Octane | OctaneBench suite | 2,00× | 1,98× |
Yukarıdan aşağı okunduğunda net bir ayrım ortaya çıkmaktadır. V-Ray ve Octane her iki kartta da 2,00×'e eşit ya da biraz altında kalıyor — ikinci bir GPU çıktıyı neredeyse ikiye katlamaktadır. Cycles, 1,31× ile 1,63× aralığına yerleşiyor. Redshift, 5090'da 1,68×, 4090'da ise 1,92× değerine ulaşıyor.

Çift RTX 5090 ve çift RTX 4090 node'larında motor başına 1 GPU'dan 2 GPU'ya ölçeklendirmeyi gösteren çubuk grafik: Cycles 1,31×'den 1,63×'e, Redshift 1,68×'e karşı 1,92×, V-Ray ve Octane 2,00×'e yakın
Yani "ikinci GPU eklemek hızımı ikiye katlar mı?" sorusunun neye render ettiğinize göre üç farklı dürüst yanıtı vardır: V-Ray ve Octane için temelde evet, Cycles için yaklaşık 1,5× artış, Redshift için ise ikisi arasında bir değer. Tek bir çarpanın tüm render işlemlerini kapsadığını söyleyen biri bunu gerçekten ölçmemiş demektir.
Aktarım Hızı Odaklı Motorlar Render Süresi Odaklı Motorlardan Neden Daha İyi Ölçeklenir?
Bu örüntü rastgele değildir — her benchmark'ın zamanını nasıl harcadığından kaynaklanmaktadır. V-Ray Benchmark ve OctaneBench, aktarım hızı testleridir. Mevcut hesaplama kapasitesine iş yükü yayarlar ve bir puan raporlarlar; sabit kurulum maliyeti (sahneyi yükleme, hızlanma yapılarını oluşturma, cihazı başlatma) toplam çalışmanın küçük bir dilimidir. İkinci bir kart eklendiğinde bu ek silikon neredeyse tamamen yararlı işe dönüşür; böylece 2×'e yakın sonuç elde edilir. V-Ray RTX sonucunun her iki kartta da net 2,00×'e ulaşması, ek yükün temelde gürültü olduğu bir iş yükünden tam olarak beklenen sonuçtur.
Render süresi odaklı motorlar farklı davranır. Bir Cycles veya Redshift render'ı duvar saati saniyeleriyle ölçtüğünüzde, tüm işi zamanlıyorsunuzdur — ve her işte sabit miktarda paralel olmayan ek yük bulunur: sahne ayrıştırma, BVH/hızlanma yapısı oluşturma, kernel derleme ve ısınma, cihaz koordinasyonu, son piksel çözümü. İkinci GPU, kartlar arasında gerçekten bölünebilen kısmı hızlandırır. Sabit kısım için hiçbir şey yapmaz. Toplam render süresinin ne kadarı sabit ek yükten oluşuyorsa, ölçeklendirme 2×'in o kadar altına düşer.
Cycles junkshop'un (1,31×–1,38×) Cycles classroom'dan (1,59×–1,63×) daha kötü ölçeklenmesinin nedeni budur: junkshop daha hafif ve kısa bir render'dır; dolayısıyla sabit ek yükü toplamın daha büyük bir bölümünü oluşturur ve ikinci kart için hızlandıracak daha az alan bırakır. Classroom sahnesi daha uzun sürer, paralel bölüm baskın hâle gelir ve ikinci GPU daha fazla yardım edecek alan bulur. Aynı motor, aynı donanım — sahne, ikinci kartın ne kadar önemli olduğunu belirler.
Sezgiye Aykırı Kısım: Daha Hızlı Kart Daha Az Ölçeklendi
Redshift satırına tekrar bakın. İki RTX 5090, 1,68× ölçeklendi. İki RTX 4090 ise 1,92× ölçeklendi. Daha yeni ve daha hızlı kart daha kötü ölçeklendi. Bu bir hata gibi görünüyor. Değil — tüm setin en öğretici sayısı bu.
İşleyiş şu şekildedir. 5090, mutlak değer olarak daha hızlı karttır; tek GPU kullanımında Vultures sahnesini yaklaşık 57 saniyede tamamlarken 4090 yaklaşık 100 saniyede tamamlar. Ancak render başına sabit ek yük — ayrıştırma, oluşturma, ısınma — hangi kartın çalıştığından bağımsız olarak yaklaşık aynı saniyedir. 4090'da bu sabit dilim uzun bir 100 saniyelik render'ın küçük bir bölümüdür; dolayısıyla ikinci kart çiğneyecek büyük bir paralel bölüme sahiptir ve ölçeklendirme 1,92×'e yaklaşır. 5090'da render zaten kısa olduğu için aynı sabit dilim toplamın daha büyük bir bölümünü oluşturur; bu da ikinci kartın hızlandırabileceği daha küçük bir paralel bölüm bırakır — ve ölçeklendirme 1,68×'de kalır.
Kritik olarak bu, 5090'ın daha kötü olduğu anlamına gelmez. Tek kartta da iki kartta da daha hızlıdır. Yalnızca ikinci GPU'dan orantısal olarak daha az kazanır; çünkü başlangıçta hızlandıracak daha az yavaş render'ı vardı. Temel render hızınız ne kadar yüksekse, ikinci kartın temiz bir 2× sağlaması o kadar zorlaşır — paralelleştirmek için yeterince zaman kalmaz. Bu, aynı kartları doğrusal kazanım bekleyerek üst üste yığmak için para harcamadan önce gerçekten anlaşılması gereken bir kavramdır.
Kart Başına Hız: RTX 5090 ile RTX 4090 Karşılaştırması
Ölçeklendirme bir eksen; ham kart başına hız ise diğeridir. Tek kart kullanımında, yöntem bölümünden sürücü uyarısı dikkate alınarak, 5090 test ettiğimiz her motorda öne çıktı:
| Motor | Metrik | RTX 5090 | RTX 4090 | 5090 avantajı |
|---|---|---|---|---|
| Cycles — bmw27 | saniye (düşük daha iyi) | 49,45 | 77,40 | 1,57× |
| Cycles — classroom | saniye | 23,09 | 36,87 | 1,60× |
| Cycles — junkshop | saniye | 19,71 | 34,43 | 1,75× |
| Redshift — Vultures | saniye | 57 | 100 | 1,75× |
| V-Ray GPU (CUDA) | vpaths (yüksek daha iyi) | 11.051 | 7.419 | 1,49× |
| V-Ray GPU (RTX) | vpaths | 15.333 | 9.608 | 1,60× |
| Octane | OctaneBench puanı | 1.690,78 | 1.074,17 | 1,57× |
Genel olarak 5090, kart başına yaklaşık 1,5× ile 1,75× daha hızlıdır. Donanım planlaması yapanlar için iki çıkarım söz konusudur. Birincisi, nesiller arası kart başına kazanımlar (burada 1,5×–1,75×), render süresi motorunda aynı nesil ikinci kart eklemenin sağladığı kazanımdan (genellikle 2×'in çok altında) daha büyük ve daha öngörülebilirdir. Açıkça söylemek gerekirse: daha hızlı bir kart çoğunlukla ikinci kartten daha iyi bir kaldıraçtır. İkincisi, bu tek kart nesiller arası sayılar, sürücü uyumsuzluğu uyarısını taşır — bunlara yönlendirici bir karşılaştırma olarak bakılmalı, hizmet düzeyi güvencesi olarak değil. Benchmark sahnelerinde ölçüm yapıyoruz; sahne karmaşıklığınız, örnekleme düzeyiniz ve çıkış çözünürlüğünüz gerçek dünya rakamını değiştirecektir. Tek kart 5090 davranışı hakkında daha fazla bilgi için RTX 5090 GPU cloud rendering performans yazımıza bakabilirsiniz.
İki GPU Node Başına Tavandır — Bu Neden Sorun Değil
Burası net bir çizgi çizmemiz gereken nokta; çünkü çoğu çoklu GPU içeriğinin sessizce atladığı bölüm budur. Bu benchmark'taki her node iki GPU'lu bir node'dur. İki kart, node başına tavandır. Size 4× ya da 8× tek node ölçeklendirme eğrisini göstermeyeceğiz, çünkü bu bizim çalıştırdığımız bir yapılandırma değil ve bunu başka türlü ima etmeyeceğiz.
Tek bir kare üzerinde iki GPU'nun ötesine geçmek, çok node'lu dağıtık rendering anlamına gelir — bir görüntüyü birden fazla makineye bölerek ağ koordinasyonu, bucket/tile yönetimi ve buna bağlı ek yük söz konusudur. Bu, gerçekten ayrı bir mimariden oluşmaktadır; iki kartlı kutunun daha büyük bir versiyonu değildir. Bugün tek bir kare için sunduğumuz bir hizmet değildir; bu nedenle bunu "yakında geliyor" özelliği olarak sunmayacağız.
İşin gerçeği şu: üretim işlerinin büyük çoğunluğu için iki GPU tavanı asıl kısıtlayıcı faktör değildir. İlk baskıyı yapan kısıtlama neredeyse her zaman kart sayısı değil, VRAM'dir — 32 GB'a sığmayan bir sahne kaç GPU kullanıldığına bakılmaksızın render edilemez; bu bambaşka bir sorundur (karmaşık sahneler için RTX 5090 VRAM sınırları konusunda ayrıca yazdık). İnsanlar "render farm'ı ölçeklendirme" hayal ettiklerinde, genellikle giderek daha fazla silikon üzerinde hızlanan tek büyük bir render hayal ederler. Farm ölçeğinde aktarım hızı böyle işlemez.
Bir Render Farm Gerçekte Nasıl Ölçeklenir: Kareler, Kartlar Değil
Bu, içselleştirilmeye değer ayrımdır ve yukarıdaki benchmark sayılarının sürekli işaret ettiği şeydir. İnsanların "daha fazla donanımda daha hızlı render" derken kastettiği iki tamamen farklı şey vardır:
- Bir kareyi birden fazla GPU veya makineye bölmek (tile/bucket dağıtık rendering). Bu, iki kart ölçeğindeki 1×→2× sayıların ölçtüğü şeydir; çok node'lu dağıtık rendering de bunu genişletecektir. Verinin gösterdiği gibi, render süresi motorlarında sabit render başı ek yük nedeniyle hızla verim düşüşüyle karşılaşır — koordinasyon maliyeti ise makine eklendikçe büyür.
- Pek çok kareyi pek çok makineye yaymak (kare paralel rendering). Her node tüm kareyi kendi başına render eder; bir animasyonun kareleri filoda paralel olarak dağıtılır. Savaşılacak tek kare koordinasyon ek yükü yoktur; bu nedenle temiz biçimde ölçeklenir ve bir animasyonun hızla tamamlanması böyle sağlanır.

İki bölümlü kavram diyagramı: birden fazla GPU'ya bölünen tek kare koordinasyon ek yüküyle karşılaşır ve verim düşüşü yaşanır; her biri kendi iki GPU'lu node'unda olan pek çok tam kare paralel olarak temiz biçimde ölçeklenir; bu, bir render farm'ın animasyonu ölçeklendirme şeklidir
Yönetilen bir render farm'ı hızını neredeyse tamamen ikinci modelden alır. 500 karellik animasyonunuz, 500 GPU'ya yayılmış tek bir kare olarak render edilmez — 500 kare olarak filoya dağıtılır; her biri kendi node'unda, hepsi aynı anda. Node ve kare başına hız, burada benchmark'ladığımız iki GPU ölçeklendirmesi ve kart başına performans türüyle belirlenir; farm düzeyindeki hız ise kaç karenin eş zamanlı çalıştığından gelir. Bunlar farklı kaldıraçlardır ve "kaç GPU'ya ihtiyacım var" konusundaki karışıklığın büyük bölümü bu ikisinin birbirine karıştırılmasından kaynaklanmaktadır.
Bu nedenle çoklu GPU'nun dürüst çerçevesi, pazarlama versiyonundan daha dardır. Node başına iki kart size gerçek ve ölçülebilir bir artış sağlar — V-Ray ve Octane'de 2×'e yakın, Cycles ve Redshift'te daha mütevazı. Bunun ötesinde yanıt, "kutuya daha fazla kart yığmak" değil "daha fazla node'a daha fazla kare yaymak"tır. Bu mimaridir; bunu açıkça ifade etmek, insanları beklentilerini karşılamayacak donanım için para harcamaktan koruma eğilimindedir.
Render Yönteminizi Seçerken Bu Ne Anlama Geliyor?
Eyleme dönüştürebileceğiniz bir özet. Bir iş istasyonu için bir kart ile iki kart arasında karar veriyorsanız, kullandığınız motor belirleyici olmalıdır: V-Ray veya Octane kullanıcıları tam ikiye katlamaya yakın bir sonuç elde eder ve ikinci kart kolayca haklı çıkarılabilir; Cycles ve Redshift kullanıcıları 1,3×–1,9× artış beklemeli ve daha hızlı tek kartın (1,5×–1,75× nesil kazanımı) daha iyi bir harcama olup olmadığını değerlendirmelidir. Yerel olarak render yapıp yapmayacağınıza yoksa işi bir farm'a mı devredeceğinize karar veriyorsanız, farm avantajının bir animasyonda kare paralel aktarım hızından geldiğini, sihirli bir tek kare çarpanından değil, hatırlayın — tek bir kahraman sabit görüntü, karşılaştırılabilir bir iş istasyonundan çarpıcı biçimde daha hızlı render edilmeyecektir; ancak birkaç yüz kare kesinlikle hızlanacaktır.
Yönetilen ve kendin-yap render farm karşılaştırması hakkında — sürücüleri, lisanslamayı ve node yapılandırmasını kimin üstlendiğine dair — tam yönetimli ve kendin-yap render farm karşılaştırmamıza göz atabilirsiniz. Farm'ımızda render motoru lisanslaması (V-Ray, Redshift, Octane) rendering ücretine dahildir ve node yapılandırması sizin tarafınızdan kurulmaz ya da ayarlanmaz. Redshift-on-Cinema-4D tarafına özellikle 1,68× ölçeklendirme rakamının düştüğü yer için Cinema 4D için Redshift render farm rehberimize bakabilirsiniz.
Buradaki ölçümler kasıtlı olarak abartısızdır. İkinci GPU gerçek sınırlara sahip gerçek bir kaldıraçtır; daha hızlı kart hızlandıracak daha az yavaş render kaldığı için daha az ölçeklenir ve farm ölçeğindeki hız bir kare dağıtım hikâyesidir, kart istifleme hikâyesi değil. İş yükünüze hangi kaldıracın uygulandığını bilmek, kararın büyük bölümünü oluşturmaktadır.
FAQ
Q: İkinci bir GPU eklemek render hızını ikiye katlar mı? A: Genellikle hayır. 2026 benchmark'larımızda V-Ray ve Octane gibi aktarım hızı odaklı motorlar, ikinci bir özdeş kartla 2,00×'e yakın ölçeklendi; ancak render süresi odaklı motorlar daha düşük kaldı — Cycles 1,31× ile 1,63× arasında kaldı, Redshift ise çift RTX 5090'da 1,68×'e ulaştı. Kazanım tamamen motora ve sahneye bağlıdır; çünkü her render, ikinci kartın hızlandıramadığı sabit bir ek yük barındırır.
Q: Redshift neden RTX 5090'da RTX 4090'dan daha kötü ölçekleniyor? A: 5090 daha hızlı olduğu için render süreleri daha kısa olur; bu da sabit render başı ek yükünün (sahne ayrıştırma, hızlanma yapısı oluşturma, kernel ısınması) toplamın daha büyük bir bölümünü oluşturduğu anlamına gelir. Bu, ikinci kartın hızlandırabileceği daha küçük bir paralel bölüm bırakır; dolayısıyla ölçeklendirme 5090'da 1,68× ile 4090'daki 1,92×'in gerisinde kalır. 5090 yine de hem tek hem de çift kartta daha hızlıdır — yalnızca ikinci GPU'dan orantısal olarak daha az kazanır.
Q: RTX 5090, render için RTX 4090'dan ne kadar daha hızlı? A: Test ettiğimiz motorlarda kart başına yaklaşık 1,5× ile 1,75× daha hızlı; bu motorlar Cycles, Redshift, V-Ray GPU ve Octane'i kapsamaktadır. Bu tek kart nesiller arası rakamlar, iki kartın farklı NVIDIA sürücüleri üzerinde çalışmasından kaynaklanan küçük bir uyarı taşıdığı için bunlara yönlendirici bir karşılaştırma olarak bakılmalıdır, sabit bir güvence olarak değil.
Q: V-Ray ve Octane neden Cycles ve Redshift'ten daha iyi ölçekleniyor? A: V-Ray Benchmark ve OctaneBench, sabit kurulum maliyetinin çalışmanın küçük bir bölümü olduğu aktarım hızı testleridir; bu nedenle ikinci kart neredeyse tamamen yararlı işe katkıda bulunur ve ölçeklendirme 2,00×'e yaklaşır. Cycles ve Redshift, ikinci kartın hızlandıramadığı paralel olmayan ek yükü barındıran toplam render süresiyle ölçülür; bu nedenle ölçeklendirmeleri 2×'in altında kalır.
Q: Bir render farm, tek bir kareyi pek çok makinede daha hızlı render edebilir mi? A: Tek kareyi birden fazla makineye bölmek çok node'lu dağıtık rendering'dir; bu kendi koordinasyon ek yüküne sahip ayrı bir mimaridir ve bugün tek bir kare için sunduğumuz bir hizmet değildir. Yönetilen bir farm bunun yerine kare paralel rendering ile hızını alır — pek çok tam kare aynı anda pek çok node'a dağıtılır — bu nedenle animasyon hızla tamamlanırken tek bir kahraman kare yaklaşık node başına hızda render edilir.
Q: Rendering için gerçekte kaç GPU'ya ihtiyacım var? A: Tek bir node için iki GPU makul bir tavandır ve benchmark node'larımız da bu yapıyı kullanmaktadır; bunun ötesinde pratik kısıt genellikle kart sayısı değil VRAM'dir; çünkü belleğe sığmayan sahne kaç kart eklediğinizden bağımsız olarak render edilemez. Animasyon render ediyorsanız, gerçek aktarım hızı daha fazla kareti daha fazla node'a yaymaktan gelir; tek bir makineye daha fazla kart yığmaktan değil.
Q: Bu benchmark sayıları kamuya açık Blender Open Data puanlarıyla karşılaştırılabilir mi? A: Hayır. Blender Cycles'ı %200 çözünürlükte çalıştırdık — Open Data varsayılanından daha ağır — böylece her render stabil bir ölçeklendirme oranı üretecek kadar uzun sürdü. Bu, ham Cycles sürelerimizi kamuya açık Open Data liderlik tablolarıyla kasıtlı olarak karşılaştırılamaz kılar — sahneler standart puanlarla eşleşmek için değil, ölçeklendirmeyi ölçmek amacıyla ayarlandı.
Q: Yönetilen bir render farm kullanmak için GPU sürücülerini ve lisansları yönetmem gerekir mi? A: Hayır. Tam yönetimli bir farm'da node yapılandırması, sürücüler ve render motoru lisanslaması (V-Ray, Redshift, Octane) sizin için yönetilir ve rendering ücretine dahildir; bu nedenle iki GPU node kurulumu ve bu benchmark'ların arkasındaki sürücüler sizin tarafınızdan kurulup ayarlanmaz. Cycles ücretsiz ve açık kaynaklıdır, dolayısıyla ayrı bir lisans gerektirmez.
About Thierry Marc
3D Rendering Expert with over 10 years of experience in the industry. Specialized in Maya, Arnold, and high-end technical workflows for film and advertising.


