Sifat alami energi gelap dan teori sempurna gravitasi
adalah dua pertanyaan utama yang dihadapi oleh para ahli kosmologi saat ini.
Seiring evolusi kosmos, ekspansi alam semesta setelah Big Bang awalnya melambat karena tarikan kuat gaya gravitasi. Saat ini, energi gelap,
substansi misterius yang tampaknya melekat pada ruang telah mendorong lalu ekspansi alam semesta dan mengatasi gaya gravitasi, tak sekadar menyebabkan alam semesta meluas dengan cepat, namun juga mengakselerasi laju ekspansi alam semesta.
Meskipun mendominasi komposisi alam semesta sebesar 72%, sifat alami energi gelap tetap tidak
diketahui. Sebagian besar studi kosmologis saat ini mencoba untuk mempelajari interaksi antara gravitasi dan energi gelap sebagai upaya memahami keadaan alam
semesta saat ini.
Masalah terbuka yang dihadapi bidang astronomi dan kosmologi adalah untuk menghitung 3-titik fungi korelasi dari anisotropik dan isotropik yang menyediakan informasi mengenai struktur alam semesta. Anisotropik adalah situasi
bagi sifat-sifat yang berbeda secara sistematik tergantung pada arah,
sedangkan isotropik adalah keseragaman sifat secara sistematik tergantung pada arah. Menurut Prabhat, direktur Big Data Center (BDC) dan penanggung jawab tim Data and Analytics and
Services team at Lawrence Berkeley National Laboratory’s (Berkeley Lab) National Energy Research Scientific
Computing Center (NERSC), "Para ahli kosmologi dan astronomi sejak dulu ingin
melakukan komputasi 3-titik, tapi belum dapat melakukannya karena tidak memiliki akses ke metode terukur dan perhitungan yang sangat
optimal untuk diterapkan ke sekumpulan data."
Sebuah proyek yang diberi nama Galactos telah membuat
terobosan besar dengan menjalankan perhitungan 3-titik korelasi di
Outer Rim, atau kumpulan data galaksi terbesar yang mengandung informasi hingga dua miliar galaksi. Proyek Galactos merupakan
bagian dari kolaborasi Big Data Center antara NERSC, Laboratorium Berkeley dan
Intel.
"Intinya, kami melakukan komputasi 3-titik
fungi korelasi terhadap dua miliar galaksi dalam waktu
kurang dari 20 menit dan telah memecahkan masalah bagaimana menghitung fungsi 3-titik
korelasi untuk dekade berikutnya. Pekerjaan ini tidak mungkin dilakukan tanpa
menggunakan sistem komputer performa tinggi, algoritma efisien, dan optimalisasi perangkat lunak," Prabhat menjelaskan.
Tinjauan Proyek Galactos
Menurut Debbie Bard, seorang arsitek Big
Data, Laboratorium Berkeley akan menjadi tuan rumah dalam sesi publikasi mengenai
topik ini di Intel HPC Developers Conference. "Statistik yang digunakan tim untuk mengkarakterisasi struktur
materi di alam semesta terletak pada fungsi korelasi. Perhitungan kami memberikan
informasi tentang pengelompokan materi berdasarkan pengetahuan tentang
sifat gravitasi dan energi gelap. 2-titik fungsi korelasi melihat bagaimana galaksi didistribusikan di alam semesta. Perhitungan 3-titik fungsi korelasi memberikan lebih banyak detail tentang struktur alam semesta,
karena penambahan dimensi ekstra. Perhitungan 3-titik fungsi
korelasi jarang dipelajari karena sangat sulit untuk dihitung dan memerlukan komputasi canggih. Kami berpikir jika dapat dipecahkan dari sudut
pandang algoritma dan komputasi, maka kita akan memberikan akses tambahan informasi struktur alam semesta kepada para ilmuwan."
![]() |
Gambar 1: Seiring waktu, gaya tarik gravitasi dan gaya dorong ekspansi energi gelap menciptakan struktur materi menyerupai jaringan di alam semesta. Courtesy of Lawrence Berkeley National Laboratory. |
Proses yang Digunakan dalam Komputasi 3-titik
Gambar 2 menunjukkan simulasi citra miniatur alam semesta yang mengandung 225.000 galaksi dalam sebuah kotak dan memberikan
informasi tentang bagaimana galaksi cenderung dikelompokkan secara terstruktur
daripada didistribusikan secara acak. Proses komputasi Galactos melibatkan tiga
langkah utama. Di sekitar sebuah galaksi primer yang dipilih, algoritma akan terlebih dahulu mengumpulkan semua galaksi tetangga (sekunder) dalam jarak
maksimum Rmax dan memasukkannya ke dalam cangkang berbentuk lingkaran/bola. Kemudian
memutar semua koordinat sehingga garis penglihatan ke arah galaksi primer dari sudut pandang pengamat berada di sepanjang sumbu z, dan mentransfer semua vektor pemisahan
kedua dari primer ke dalam bingkai tersebut. Kemudian algoritma memperluas
sudut anistropik dari galaksi dalam setiap tempat menjadi harmonik sferis, atau seperangkat fungsi matematika tertentu. Ekspansi ditunjukkan oleh bayangan di bagian ekspansi dari grafik. Harmonik sferis adalah pergerakan partikel dalam
potensial terpusat sekitar titik asal koordinat, distribusi dari
orientasi momentum sudut dinyatakan oleh kuadrat modulus dari keadaan eigen
momentum sudut.
![]() |
Gambar 2: Simulasi proses yang digunakan dalam proyek Galactos. Courtesy of Lawrence Berkeley National Laboratory. |
Algoritma Galactos diparalelkan melintasi
node dengan mengambil keseluruhan 2 miliar galaksi dalam rangkaian data dan memecahnya
menjadi kotak yang lebih kecil menggunakan pohon algoritma k-d yang dikembangkan oleh Intel dan terbukti efisien. Node adalah salah satu titik
sambungan, titik redistribusi, atau titik akhir komunikasi (beberapa terminal
peralatan). Ada juga komponen pertukaran komponen lingkaran halo untuk memperluas kotak konstan
sebesar 200 megaparsec (200 Mpc=300 juta tahun cahaya) di setiap sisi dan
menarik semua galaksi yang berada di wilayah luas. Setiap node memiliki
semua galaksi yang dibutuhkan untuk menentukan 3-titik fungsi korelasi penuh
dan tidak perlu berkomunikasi dengan node lain sampai akhir.
Algoritma O(N2) Mempercepat Komputasi 3-titik Fungsi Korelasi
Galactos menggunakan algoritma O(N2) yang sangat
terukur, yang awalnya dibuat oleh Zachary Slepian, salah satu kolega Einstein di
Laboratorium Berkeley, bersama Daniel Einstein, penasihat PhD Slepian
dan profesor astronomi di Universitas Harvard. Selain itu, tim menggunakan kumpulan
algoritma optimal pohon k-d untuk melakukan partisi spasial galaksi. Brian
Friesen (Laboratorium Berkeley, Konsultan HPC) dan Intel bekerja sama untuk
mengoptimalkan kode agar bisa berjalan di semua 9.636 node superkomputer NERSC
Cori.
Menurut Slepian, "Menghitung setiap kemungkinan
dari segitiga yang dibentuk oleh satu set objek adalah tantangan menarik secara
kombinatorial: ada sejumlah besar hasil perhitungan untuk probabilitas segitiga.
Untuk objek N, ada opsi N untuk pilihan pertama, N-1 untuk yang kedua, dan N-2
untuk yang ketiga, yang mengarah ke segitiga N(N-1)(N-2). Jika jumlah objek benda
sangat besar, berarti kira-kira N^3.
Kunci utama algoritma O(N2) terletak pada susunan ulang proses penghitungan untuk mengurangi penskalaan ke N2. Dalam
prakteknya, berarti 500 kali lebih cepat daripada perhitungan biasa.
Algoritma mengeksploitasi fakta bahwa dalam
kosmologi, ia ingin menempatkan hasil perhitungan dalam panjang sisi segitiga.
Sebagai contoh, saya mungkin melaporkan hasil untuk segitiga dengan sisi
pertama antara 30 dan 60 juta tahun cahaya dan sisi kedua antara 90 dan 120
juta tahun cahaya. Algoritma kami berhasil melakukan penempatan ini terlebih
dahulu, jadi kita tidak harus membandingkan kombinasi tiga galaksi, namun
membandingkan kombinasi setiap penempatan. Ada lebih sedikit bins daripada jumlah galaksi, jadi inilah penghematan besar dalam komputasi.
Algoritma melakukannya dengan menulis masalah
menggunakan seperangkat fungsi matematis tertentu, atau basis, yang ideal untuk masalah ini. Basis kami memiliki simetri yang sama
dengan pengelompokan galaksi dan dapat secara kompak mewakili informasi yang yang dikandung dalam pengelompokan. Selanjutnya, himpunan fungsi ini, yang disebut
polinomial Legendre, dapat dipecah menjadi lingkaran harmonik sferis."
Optimalisasi dan Vektorisasi yang Digunakan
dalam Proyek Galactos
Menurut Friesen, "Optimasi Galactos
terdiri dari dua komponen, termasuk single node dan skala multi-node. Penskalaan
multi-node menggunakan algoritma pohon k-d, yang merupakan pohon k-d multi-node
dengan membangun Message Passing Interface (MPI) di dalamnya. Pohon k-d
digunakan untuk mempartisi kumpulan data dari elemen data yang saling berdekatan untuk setiap memori penyimpanan lain. Di Galactos, pohon k-d membantu
meningkatkan kinerja saat menentukan tetangga galaksi terdekat.
"Pohon k-d juga penting untuk
keseimbangan beban komputasi antara node pada sistem," Friesen
menambahkan. "Sebagian besar perhitungan Galactos dilakukan dalam sebuah node, jadi hanya ada sedikit komunikasi antar node. Jika terjadi ketidakseimbangan
beban yang besar antar node, maka algoritma hanya menghitung secepat node paling
lambat. Tim bekerja untuk membuat beban komputasi semaksimal mungkin antar node
untuk meningkatkan kecepatan algoritma."
Mengaktifkan vektorisasi prosesor Intel
Xeon Phi yang diperlukan untuk menyortir galaksi, pasangan galaksi
yang dipisahkan oleh jarak yang sama berdampingan di dalam memori penyimpanan.
Hal ini memungkinkan algoritma untuk menghitung sifat geometris dari banyak
pasangan galaksi sekaligus menggunakan vektorisasi, daripada menghitung sifat
masing-masing pasangan galaksi secara terpisah.
Untuk proyek Galactos, Intel mengoptimalkan
kinerja dalam node tunggal Intel Xeon Phi yang dioperasikan pada superkomputer
Cray XC40. Intel sebelumnya terlibat dalam perhitungan 2-titik fungsi korelasi dengan
Laboratorium Berkeley. "Optimalisasi kami ke Galactos mencakup distribusi algoritma
pohon k-d untuk mempartisi galaksi dan memungkinkan penghitungan cepat ke galaksi tetangga terdekat manapun dan penghitungan harmonik sferis di sekitar masing-masing galaksi. Langkah 2 adalah hambatan terbesar yang dihadapi dalam komputasi
dan telah divektorisasi dari galaksi tetangga yang dipilih dengan beberapa
galaksi yang sejajar dalam rangkaian komputasi yang berbeda. Kami menggunakan perangkat yang dikembangkan oleh Intel dan telah dioptimalkan untuk prosesor Intel Xeon
Phi," kata ilmuwan Intel Narayanan Sundaram. Dalam semua
perhitungan Galactos, kode dikompilasi menggunakan kompiler Intel C++ v17.0.1 menggunakan
Cray MPI. Tim menjalankan kode dengan proses MPI tunggal per node penghitungan
Intel Xeon Phi, dengan menggunakan 272 rangkaian per node (empat rangkaian per
inti fisik).
Waktu yang Dibutuhkan Galactos untuk Menyelesaikan Hasil Uji Dataset Outer Rim
Pengujian galaksi mencakup pemecahan kinerja
kode yang menjalankan dataset Outer Rim dengan 225.000 galaksi pada node tunggal.
Kinerja node tunggal telah dioptimalkan untuk prosesor Intel Xeon Phi, mencapai
39 persen dari puncak, dengan penggunaan vektorisasi dan hirarki memori yang
efisien. Galactos mencapai penskalaan yang hampir sempurna dan kuat, mencapai 5,06 PF yang berkelanjutan pada 9636 node.
![]() |
Gambar 3: Penskalaan rendah kode Galactos di Cori, menggunakan dataset Outer Rim. Courtesy of Lawrence Berkeley National Laboratory. |
![]() |
Gambar 4: Penskalaan kuat kode Galactos di Cori, menggunakan dataset Outer Rim. Courtesy of Lawrence Berkeley National Laboratory. |
Tim menjalankan lebih dari 9.636 node
Galactos yang ada di sistem Cori, baik dalam presisi campuran maupun presisi
ganda. (Dalam presisi campuran, pohon k-d dihitung dalam presisi tunggal dan
yang lainnya dalam presisi ganda.) Waktu yang dibutuhkan untuk menyelesaikan
perhitungan 3-titik fungsi korelasi bagi 2 miliar galaksi dengan presisi
campuran adalah 982,4 detik (16,37 menit), sedangkan dalam presisi ganda murni,
waktu yang dibutuhkan untuk menyelesaikannya adalah 1.070,6 detik (17,84 menit).
Galactos Membantu Penelitian Kosmologi Masa Depan
Prabhat menyatakan, "Sebagai ilmuwan
komputer, banyak capaian prestasi yang telah kami raih dalam beberapa
tahun karena bidang yang kami tekuni berubah dengan sangat cepat. Proyek
Galactos mumpuni dalam perhitungan yang sebelumnya sulit dilakukan untuk
dijalankan di superkomputer Cori hanya dalam waktu 20 menit. Saat LSST online, kode mampu mengolah dataset besar dalam satu atau dua
hari. Proyek ini sangat memuaskan bagi tim, karena kami tidak hanya
memecahkan masalah 3-titik fungsi korelasi untuk dataset terbesar yang tersedia
pada tahun 2017, namun untuk dekade berikutnya dalam bidang astronomi. Seberapa
sering Anda bisa mengajukan klaim seperti itu?"
Ditulis
oleh: Linda Barney, www.hpcwire.com
#terimakasihgoogle
Komentar
Posting Komentar