LegendofAnatolia
Kaptan Penguen
- En iyi cevaplar
- 0
Tianhe -1A
Tianhe -1A, Çin’de bulunan The National Center For Supercomputers şirketi tarafından 2010 yılının başlarında ortaya çıkarılmış bir süper bilgisayardır. Tianhe -1A, 2010 kasım ayında Top-500 tarafından dünyanın en hızlı ve en güçlü paralel işlem yapan bilgisayarı seçilmiştir.
Bu adımla Çin, Amerika’yla birlikte petaFlop seviyede Süper bilgisayar üreten ikinci ülke olmuş oldu.
Yetkililerin bildirdiklerine göre bu bilgisayar yapısındaki mükemmel paralelizm dizaynı sayesinde saniyede 1 katrilyondan fazla hesaplama yapabiliyor. Ayrıca kişisel bir bilgisayarın 160 yıl hiç durmadan çalışarak yapabileceği bir işlemi bu bilgisayarın 1 günde yapabileceği belirtiliyor.
Bu süper bilgisayar Çok güçlü Intel işlemcileri ve Yüksek hızlı NVidia nın Grafik işlemcileri sayesinde belli bir anda çok yüksek hızda işlem yapma kapasitesine sahiptir. Şekil -1 de Tianhe -1A nın diğer süper bilgisayarlara göre performansları verilmiştir.
Şekil-1: Dünyaca ünlü Süper bilgisayarların Tianhe -1A ya göre Performansları
Tianhe -1A süper bilgisayarı birçok süper bilgisayar gibi işletim sistemi olarak Linux işletim sistemini kullanmaktadır. Bu bilgisayarın toplam disk kapasitesi 2 Petabytedır. Disk ise Lustre clustered file system dosya sistemiyle oluşturulmuştur.
Tianhe -1A nın Mimarisi ve Bileşenleri
Süper bilgisayarlar FLOPS denilen (Floating point operations per second) bir ölçümle saniyede yaptıkları iş miktarına göre kıyaslanmaktadır. Buna göre Tianhe -1A, 2.57×1015 FLOP/s=2.57 peta Flop/s kapasiteli bir süper bilgisayardır.Aşağıda bu devasa bilgisayarın bir görünümü verilmiştir.
Bu süper bilgisayar genelde Intel EM64T Xeon X56xx (Westmere-EP) 2930 MHz işlemcisini kullanır ve bellek kapasitesi de 229376 Gigabyte dır. Ayrıca Bu süper bilgisayar yapısında hem local hem de paylaşımlı bellekler bulundurur. Öte yandan Bu Intel İşlemcisi içinde Hyper-Pipelined Technology and Advanced Dynamic Execution adında bir birim barındırır.
Bu birim sayesinde Intel 128 basamaklı bir Decoder Pipeline a sahip olabilmektedir. Bu sayede paralelizmde devasa miktarda artışlar sağlanmaktadır.
Tianhe -1A vektörel işlemlere dayalı paralel işlem yapan bir bilgisayardır. Mimarisinde barındırdığı 256 bitlik vektörelişlemciler paralel olarak 16 double veya 16 tane integer sayı üzerinde aynı anda işlem yapabilmektedir. Tianhe -1A aynı zamanda kayan noktalı sayılarla işlem yapma konusunda da çok gelişmiş bir sistemdir.
Samanyolu galaksisi adı da verilen bu süper bilgisayar; çoklu çekirdekli yapısının içinde Intel 6144 işlemcisi ve bununla beraber 5120 tanede hızlandırılmış AMD grafik işlemcileri bulundurmaktadır. Farklı iki mimariye sahip bu işlemcilerin çalışma mantıklarında MIMD özelliği vardır. Çünkü farklı işlemciler aynı olmayan emir kümelerini birbirinden farklı veri parçaları üzerinde uygulamaktadırlar. İşlemciler arasında çoğu kez point to point iletişim kuran bu süper bilgisayarın bant genişliğide 40 Gbps olmaktadır.
Tianhe -1A mimarisel olarak 2560 tane node dan oluşur. Ve bu nodelar genelde TriBlade şeklindedir. 2560 düğümün her biri 2 adet 32 Gb lık belleğe sahip işlemci ve normalden 2 kat hızlandırılmış GPU (Graphical Processing Unit) bulundurur. Bu GPU lar aynı işlemleri birçok veri kümesi üzerinde de yaptıkları için mantıksal olarak SIMD özelliğini yansıtırlar.
Tianhe -1A sistemi; 112 bilgisayar, 12 tane depolama, 6 tane iletişim ve 8 tane ise giriş/çıkış kabinlerinden oluşmaktadır. Her bilgisayar kabini 4 frameden oluşmakta ve her framede 8 tane blade içermektedir. Bütün bu yapılar 16 portlu switching boardlarına yerleştirilmiştir. Her blade ise 2 bilgisayar düğümünden oluşmaktadır. Bu bilgisayar düğümlerinin her biri 2 tane Xeon X5670 6 çekirdekli işlemciler ve 1 tane Nvidia M2050 GPU işlemcilerinden oluşur. Bu sistem her birinde 7168 tane GPU olmak üzere toplamda 3584 tane blade ve 14336 tane de CPU ya sahiptir.
Burda ki tüm süreçler SLURM (Simple Linux Utility For Resource Management) denilen tarifeleyici sayesinde tarifelenir. Bu sistemde kullanılan Intel işlemcileri Coarse Grain seviyede işlem yaparlar. İşlemleri emir emir koşmaktansa program yada procedure seviyesinde koşmayı tercih etmektedirler. Bu yüzden bu işlemcilerin paralelizmleri az miktarda olmaktadır. Grafik işlemcileri NVidia kadar paralelizmleri yüksek değildir.
Tianhe -1A, 14336 tane Xeon X5670 işlemcisi ve 7160 tane de genel amaçlı Nvidia Tesla M2050 GPU suyla donatılmıştır. İntel ve NVidia nın farklı mimarideki işlemcileri aynı veriler üzerinde farklı farklı işlemler gerçekledikleri için bu yönüyle MISD özelliğini yansıtırlar.
Bu sistem de NUDT FT1000 tipinde heterojen işlemciler kuruludur. Bu işlemciler farklı farklı mimarileri bünyelerinde barındırmaktadır bu yönüyle de hibrit yapıda oldukları söylenebilir.
Öte yandan Nvidia Tesla M2050 GPU larının Peak performansı 4701 petaflop a kadar ulaşabilmektedir. Bu bilgisayarlarFine Grain seviyede paralel işlemler yaptığı zaman grafik işlemcileri daha verimli olmaktadırlar ve genelde bu işlemciler yüksek paralelizm esasına göre çalışırlar.
Bu sistem iç içe girmiş clusterlardan meydana gelmiştir. Ve cluster lar Intel Xeon Chiplerine ve Advanced Micro Devices Radeon HD 4870 GPU larına dayalıdır.
Tianhe -1A Süper Bilgisayarının Paralelizmi
Tianhe -1A, hibritli bir yapıya sahip olduğu için Hücresel işlemciler içerisinde vektörel olarak yapılan paralel işlemler farklı data kümelerine aynı işlemler yapıldığı için SIMD özelliğini taşırlar. Aşağıda bu devasa bilgisayarın yapısı gösterilmiştir.
Hibritli yapıda heterojen olan bu sistem sadece CPU larla meydana gelseydi yaklaşık olarak 12 megawatt tüketirdi. Fakat sistem GPU ve CPU lardan meydana geldiği için ortalama 4.04 megawatt tüketiyor. Burda ki enerji tüketiminin üçte birine inmesi ise NVidia firmasının özel üretimli paralelizm düzeyi yüksek olan GPU ları sayesindedir.
Tianhe -1A in paralelizmin temeli olan hibrit yapısında paralellik adına vektörel yapılar, threadli işlemler, çok çekirdekli yapılar, instruction seviyesinde paralelizm için 1000 civarında ki özel komut setleri, yerel bellek ve uzak bellek gibi birçok kompleks mekanizmalar bulundurur.
Ayrıca Bu GPU lar yapısında yaklaşık 112 thread barındırmaktadır. Her bir GPU çekirdeğinin kullanışlılığını artırmak için multithreading çalışma söz konusudur.
GPU lar CPU lara server düğümleri içerisindeki PCI-Express 2.0 bus lar ile bağlanılıyor. Bu bağlantı Remote Direct Memory Access şeklindedir. Ayrıca GPU yla CPU arasında veri alışverişi ve birbirleriyle aralarındaki iletişim sırasında software-pipelining kullanılır.
Paralel bilgisayarların en önemli özelliklerinden birisi ölçeklenebilir olmasıdır ve bunu mimarilerinde kullandıkları Cluster lar sağlar. Bu süper bilgisayarın yapısında da iç içe geçmiş çok sayıda clusterlar mevcuttur. Bu Cluster lar ölçeklemeyi esnek kılacak şekilde oluşturulmuştur. Böylece bu sistem istenildiği zaman rahatlıkla genişletilebilmektedir.
Clusterlar arası data alışverişi ve haberleşme için mesaj geçme yapıları kullanılır. Yine bu seviyede paralel işlemlerde kullanılan Global arrayler için GAS, IPC, UPC gibi diller paralelizmi sağlamak için kullanılır. Clusterlar içerisinde kontrolü sağlayan kısımlarda Fine grain size da çalışılır buralarda paralelizm çok olduğu için haberleşme gecikmesi azdır.
Clusterda kontrolü Intel işlemcileri yapar ve işlemleri kendi aralarında paylaştırır. Cluster lar arası, Cluster içinde ve işlemcilerdeki hücreler içerisinde olmak üzere yüksek seviyeli paralelizmden düşük seviyeli paralelizm edoğru 3 seviyeli paralelizm bulunmaktadır.
NVidia daki Arch lar hibrit bir yapıda olup Fat tree konfigürasyonu içinde elektriksel optik kabloları kullanarak server düğümlerini birbirlerine bağlar. Arch ların kalbi niteliğindeki switchlerin iki yönlü bantgenişliği 160 Gb/sec dır. Düğümlerdeki haberleşme gecikmesi 1.57 microsaniyedir. Ve toplam bant genişliği ise 61 Tb/sec dan fazladır.
İşlemciler içindeki hücreler kendi arasında iletişimleri yok derecede olduğu için ancak Ana işlemci ile iletişimde bulunurlar bu yüzden Paralellikleri az seviyede ve iletişim gecikmesi ise fazla miktardadır. Her bir İntel çekirdeği için çok sayıda hücresel işlem birimler vardır.
İntel çekirdekleri Linux işletim sisteminden dolayı kendi içerisinde Concurrent koşma yeteneğine sahiptir. Hücre biçimindeki işlemcilerde kendi içerisinde Fine Grain size da yüksek seviyede paralelizmden yararlanarak işlemleri paralel gerçekleştirir.
Aynı zamanda Çok yollu Pipeline şekilde çalışan birimler de yer almaktadır. Hücre biçimindeki işlemciler içerisinde Grain size problemi, domainin gridler halinde parçalanmasıyla belirlenir. Böylece işlemlerin grain size ları eşitlenmiş olur.
Sonuçlar
Artan bilimsel çalışmalar beraberinde bir takım problemler getirecektir. Bunların en başında ise bir işlemin hesaplanma süresi gelmektedir. 1998 de bir süper bilgisayarın 20 yılda hesaplayabileceği bir işlemi günümüzün süper bilgisayarları 1 haftadan daha kısa sürede hesaplayabilmektedir. Belki de bundan 13 yıl sonra ortaya çıkacak süper bilgisayarlardaki bu fark öncekinden kat be kat ileriye gidecektir.
Mehmet Salih Deveci'den alıntıdır.
Tianhe -1A, Çin’de bulunan The National Center For Supercomputers şirketi tarafından 2010 yılının başlarında ortaya çıkarılmış bir süper bilgisayardır. Tianhe -1A, 2010 kasım ayında Top-500 tarafından dünyanın en hızlı ve en güçlü paralel işlem yapan bilgisayarı seçilmiştir.
Bu adımla Çin, Amerika’yla birlikte petaFlop seviyede Süper bilgisayar üreten ikinci ülke olmuş oldu.
Yetkililerin bildirdiklerine göre bu bilgisayar yapısındaki mükemmel paralelizm dizaynı sayesinde saniyede 1 katrilyondan fazla hesaplama yapabiliyor. Ayrıca kişisel bir bilgisayarın 160 yıl hiç durmadan çalışarak yapabileceği bir işlemi bu bilgisayarın 1 günde yapabileceği belirtiliyor.
Bu süper bilgisayar Çok güçlü Intel işlemcileri ve Yüksek hızlı NVidia nın Grafik işlemcileri sayesinde belli bir anda çok yüksek hızda işlem yapma kapasitesine sahiptir. Şekil -1 de Tianhe -1A nın diğer süper bilgisayarlara göre performansları verilmiştir.
Şekil-1: Dünyaca ünlü Süper bilgisayarların Tianhe -1A ya göre Performansları
Tianhe -1A süper bilgisayarı birçok süper bilgisayar gibi işletim sistemi olarak Linux işletim sistemini kullanmaktadır. Bu bilgisayarın toplam disk kapasitesi 2 Petabytedır. Disk ise Lustre clustered file system dosya sistemiyle oluşturulmuştur.
Tianhe -1A nın Mimarisi ve Bileşenleri
Süper bilgisayarlar FLOPS denilen (Floating point operations per second) bir ölçümle saniyede yaptıkları iş miktarına göre kıyaslanmaktadır. Buna göre Tianhe -1A, 2.57×1015 FLOP/s=2.57 peta Flop/s kapasiteli bir süper bilgisayardır.Aşağıda bu devasa bilgisayarın bir görünümü verilmiştir.
Bu süper bilgisayar genelde Intel EM64T Xeon X56xx (Westmere-EP) 2930 MHz işlemcisini kullanır ve bellek kapasitesi de 229376 Gigabyte dır. Ayrıca Bu süper bilgisayar yapısında hem local hem de paylaşımlı bellekler bulundurur. Öte yandan Bu Intel İşlemcisi içinde Hyper-Pipelined Technology and Advanced Dynamic Execution adında bir birim barındırır.
Bu birim sayesinde Intel 128 basamaklı bir Decoder Pipeline a sahip olabilmektedir. Bu sayede paralelizmde devasa miktarda artışlar sağlanmaktadır.
Tianhe -1A vektörel işlemlere dayalı paralel işlem yapan bir bilgisayardır. Mimarisinde barındırdığı 256 bitlik vektörelişlemciler paralel olarak 16 double veya 16 tane integer sayı üzerinde aynı anda işlem yapabilmektedir. Tianhe -1A aynı zamanda kayan noktalı sayılarla işlem yapma konusunda da çok gelişmiş bir sistemdir.
Samanyolu galaksisi adı da verilen bu süper bilgisayar; çoklu çekirdekli yapısının içinde Intel 6144 işlemcisi ve bununla beraber 5120 tanede hızlandırılmış AMD grafik işlemcileri bulundurmaktadır. Farklı iki mimariye sahip bu işlemcilerin çalışma mantıklarında MIMD özelliği vardır. Çünkü farklı işlemciler aynı olmayan emir kümelerini birbirinden farklı veri parçaları üzerinde uygulamaktadırlar. İşlemciler arasında çoğu kez point to point iletişim kuran bu süper bilgisayarın bant genişliğide 40 Gbps olmaktadır.
Tianhe -1A mimarisel olarak 2560 tane node dan oluşur. Ve bu nodelar genelde TriBlade şeklindedir. 2560 düğümün her biri 2 adet 32 Gb lık belleğe sahip işlemci ve normalden 2 kat hızlandırılmış GPU (Graphical Processing Unit) bulundurur. Bu GPU lar aynı işlemleri birçok veri kümesi üzerinde de yaptıkları için mantıksal olarak SIMD özelliğini yansıtırlar.
Tianhe -1A sistemi; 112 bilgisayar, 12 tane depolama, 6 tane iletişim ve 8 tane ise giriş/çıkış kabinlerinden oluşmaktadır. Her bilgisayar kabini 4 frameden oluşmakta ve her framede 8 tane blade içermektedir. Bütün bu yapılar 16 portlu switching boardlarına yerleştirilmiştir. Her blade ise 2 bilgisayar düğümünden oluşmaktadır. Bu bilgisayar düğümlerinin her biri 2 tane Xeon X5670 6 çekirdekli işlemciler ve 1 tane Nvidia M2050 GPU işlemcilerinden oluşur. Bu sistem her birinde 7168 tane GPU olmak üzere toplamda 3584 tane blade ve 14336 tane de CPU ya sahiptir.
Burda ki tüm süreçler SLURM (Simple Linux Utility For Resource Management) denilen tarifeleyici sayesinde tarifelenir. Bu sistemde kullanılan Intel işlemcileri Coarse Grain seviyede işlem yaparlar. İşlemleri emir emir koşmaktansa program yada procedure seviyesinde koşmayı tercih etmektedirler. Bu yüzden bu işlemcilerin paralelizmleri az miktarda olmaktadır. Grafik işlemcileri NVidia kadar paralelizmleri yüksek değildir.
Tianhe -1A, 14336 tane Xeon X5670 işlemcisi ve 7160 tane de genel amaçlı Nvidia Tesla M2050 GPU suyla donatılmıştır. İntel ve NVidia nın farklı mimarideki işlemcileri aynı veriler üzerinde farklı farklı işlemler gerçekledikleri için bu yönüyle MISD özelliğini yansıtırlar.
Bu sistem de NUDT FT1000 tipinde heterojen işlemciler kuruludur. Bu işlemciler farklı farklı mimarileri bünyelerinde barındırmaktadır bu yönüyle de hibrit yapıda oldukları söylenebilir.
Öte yandan Nvidia Tesla M2050 GPU larının Peak performansı 4701 petaflop a kadar ulaşabilmektedir. Bu bilgisayarlarFine Grain seviyede paralel işlemler yaptığı zaman grafik işlemcileri daha verimli olmaktadırlar ve genelde bu işlemciler yüksek paralelizm esasına göre çalışırlar.
Bu sistem iç içe girmiş clusterlardan meydana gelmiştir. Ve cluster lar Intel Xeon Chiplerine ve Advanced Micro Devices Radeon HD 4870 GPU larına dayalıdır.
Tianhe -1A Süper Bilgisayarının Paralelizmi
Tianhe -1A, hibritli bir yapıya sahip olduğu için Hücresel işlemciler içerisinde vektörel olarak yapılan paralel işlemler farklı data kümelerine aynı işlemler yapıldığı için SIMD özelliğini taşırlar. Aşağıda bu devasa bilgisayarın yapısı gösterilmiştir.
Hibritli yapıda heterojen olan bu sistem sadece CPU larla meydana gelseydi yaklaşık olarak 12 megawatt tüketirdi. Fakat sistem GPU ve CPU lardan meydana geldiği için ortalama 4.04 megawatt tüketiyor. Burda ki enerji tüketiminin üçte birine inmesi ise NVidia firmasının özel üretimli paralelizm düzeyi yüksek olan GPU ları sayesindedir.
Tianhe -1A in paralelizmin temeli olan hibrit yapısında paralellik adına vektörel yapılar, threadli işlemler, çok çekirdekli yapılar, instruction seviyesinde paralelizm için 1000 civarında ki özel komut setleri, yerel bellek ve uzak bellek gibi birçok kompleks mekanizmalar bulundurur.
Ayrıca Bu GPU lar yapısında yaklaşık 112 thread barındırmaktadır. Her bir GPU çekirdeğinin kullanışlılığını artırmak için multithreading çalışma söz konusudur.
GPU lar CPU lara server düğümleri içerisindeki PCI-Express 2.0 bus lar ile bağlanılıyor. Bu bağlantı Remote Direct Memory Access şeklindedir. Ayrıca GPU yla CPU arasında veri alışverişi ve birbirleriyle aralarındaki iletişim sırasında software-pipelining kullanılır.
Paralel bilgisayarların en önemli özelliklerinden birisi ölçeklenebilir olmasıdır ve bunu mimarilerinde kullandıkları Cluster lar sağlar. Bu süper bilgisayarın yapısında da iç içe geçmiş çok sayıda clusterlar mevcuttur. Bu Cluster lar ölçeklemeyi esnek kılacak şekilde oluşturulmuştur. Böylece bu sistem istenildiği zaman rahatlıkla genişletilebilmektedir.
Clusterlar arası data alışverişi ve haberleşme için mesaj geçme yapıları kullanılır. Yine bu seviyede paralel işlemlerde kullanılan Global arrayler için GAS, IPC, UPC gibi diller paralelizmi sağlamak için kullanılır. Clusterlar içerisinde kontrolü sağlayan kısımlarda Fine grain size da çalışılır buralarda paralelizm çok olduğu için haberleşme gecikmesi azdır.
Clusterda kontrolü Intel işlemcileri yapar ve işlemleri kendi aralarında paylaştırır. Cluster lar arası, Cluster içinde ve işlemcilerdeki hücreler içerisinde olmak üzere yüksek seviyeli paralelizmden düşük seviyeli paralelizm edoğru 3 seviyeli paralelizm bulunmaktadır.
NVidia daki Arch lar hibrit bir yapıda olup Fat tree konfigürasyonu içinde elektriksel optik kabloları kullanarak server düğümlerini birbirlerine bağlar. Arch ların kalbi niteliğindeki switchlerin iki yönlü bantgenişliği 160 Gb/sec dır. Düğümlerdeki haberleşme gecikmesi 1.57 microsaniyedir. Ve toplam bant genişliği ise 61 Tb/sec dan fazladır.
İşlemciler içindeki hücreler kendi arasında iletişimleri yok derecede olduğu için ancak Ana işlemci ile iletişimde bulunurlar bu yüzden Paralellikleri az seviyede ve iletişim gecikmesi ise fazla miktardadır. Her bir İntel çekirdeği için çok sayıda hücresel işlem birimler vardır.
İntel çekirdekleri Linux işletim sisteminden dolayı kendi içerisinde Concurrent koşma yeteneğine sahiptir. Hücre biçimindeki işlemcilerde kendi içerisinde Fine Grain size da yüksek seviyede paralelizmden yararlanarak işlemleri paralel gerçekleştirir.
Aynı zamanda Çok yollu Pipeline şekilde çalışan birimler de yer almaktadır. Hücre biçimindeki işlemciler içerisinde Grain size problemi, domainin gridler halinde parçalanmasıyla belirlenir. Böylece işlemlerin grain size ları eşitlenmiş olur.
Sonuçlar
Artan bilimsel çalışmalar beraberinde bir takım problemler getirecektir. Bunların en başında ise bir işlemin hesaplanma süresi gelmektedir. 1998 de bir süper bilgisayarın 20 yılda hesaplayabileceği bir işlemi günümüzün süper bilgisayarları 1 haftadan daha kısa sürede hesaplayabilmektedir. Belki de bundan 13 yıl sonra ortaya çıkacak süper bilgisayarlardaki bu fark öncekinden kat be kat ileriye gidecektir.
Mehmet Salih Deveci'den alıntıdır.