Langsung ke konten utama

Proyek Galactos Memecahkan Salah Satu Tantangan Tersulit Kosmologi

proyek-galactos-memecahkan-salah-satu-tantangan-tersulit-kosmologi-astronomi

Sifat alami energi gelap dan teori sempurna gravitasi adalah dua pertanyaan utama yang dihadapi oleh para ahli kosmologi saat ini. Seiring evolusi kosmos, ekspansi alam semesta setelah Big Bang awalnya melambat karena tarikan kuat gaya gravitasi. Saat ini, energi gelap, substansi misterius yang tampaknya melekat pada ruang telah mendorong lalu ekspansi alam semesta dan mengatasi gaya gravitasi, tak sekadar menyebabkan alam semesta meluas dengan cepat, namun juga mengakselerasi laju ekspansi alam semesta.

Meskipun mendominasi komposisi alam semesta sebesar 72%, sifat alami energi gelap tetap tidak diketahui. Sebagian besar studi kosmologis saat ini mencoba untuk mempelajari interaksi antara gravitasi dan energi gelap sebagai upaya memahami keadaan alam semesta saat ini.

Masalah terbuka yang dihadapi bidang astronomi dan kosmologi adalah untuk menghitung 3-titik fungi korelasi dari anisotropik dan isotropik yang menyediakan informasi mengenai struktur alam semesta. Anisotropik adalah situasi bagi sifat-sifat yang berbeda secara sistematik tergantung pada arah, sedangkan isotropik adalah keseragaman sifat secara sistematik tergantung pada arah. Menurut Prabhat, direktur Big Data Center (BDC) dan penanggung jawab tim Data and Analytics and Services team at Lawrence Berkeley National Laboratory’s (Berkeley Lab) National Energy Research Scientific Computing Center (NERSC), "Para ahli kosmologi dan astronomi sejak dulu ingin melakukan komputasi 3-titik, tapi belum dapat melakukannya karena tidak memiliki akses ke metode terukur dan perhitungan yang sangat optimal untuk diterapkan ke sekumpulan data."

Sebuah proyek yang diberi nama Galactos telah membuat terobosan besar dengan menjalankan perhitungan 3-titik korelasi di Outer Rim, atau kumpulan data galaksi terbesar yang mengandung informasi hingga dua miliar galaksi. Proyek Galactos merupakan bagian dari kolaborasi Big Data Center antara NERSC, Laboratorium Berkeley dan Intel.

"Intinya, kami melakukan komputasi 3-titik fungi korelasi terhadap dua miliar galaksi dalam waktu kurang dari 20 menit dan telah memecahkan masalah bagaimana menghitung fungsi 3-titik korelasi untuk dekade berikutnya. Pekerjaan ini tidak mungkin dilakukan tanpa menggunakan sistem komputer performa tinggi, algoritma efisien, dan optimalisasi perangkat lunak," Prabhat menjelaskan.

Tinjauan Proyek Galactos

Menurut Debbie Bard, seorang arsitek Big Data, Laboratorium Berkeley akan menjadi tuan rumah dalam sesi publikasi mengenai topik ini di Intel HPC Developers Conference. "Statistik yang digunakan tim untuk mengkarakterisasi struktur materi di alam semesta terletak pada fungsi korelasi. Perhitungan kami memberikan informasi tentang pengelompokan materi berdasarkan pengetahuan tentang sifat gravitasi dan energi gelap. 2-titik fungsi korelasi melihat bagaimana galaksi didistribusikan di alam semesta. Perhitungan 3-titik fungsi korelasi memberikan lebih banyak detail tentang struktur alam semesta, karena penambahan dimensi ekstra. Perhitungan 3-titik fungsi korelasi jarang dipelajari karena sangat sulit untuk dihitung dan memerlukan komputasi canggih. Kami berpikir jika dapat dipecahkan dari sudut pandang algoritma dan komputasi, maka kita akan memberikan akses tambahan informasi struktur alam semesta kepada para ilmuwan."

gaya-tarik-gravitasi-dan-gaya-ekspansif-energi-gelap-astronomi
Gambar 1: Seiring waktu, gaya tarik gravitasi dan gaya dorong ekspansi energi gelap menciptakan struktur materi menyerupai jaringan di alam semesta.
Courtesy of Lawrence Berkeley National Laboratory.

Proses yang Digunakan dalam Komputasi 3-titik

Gambar 2 menunjukkan simulasi citra miniatur alam semesta yang mengandung 225.000 galaksi dalam sebuah kotak dan memberikan informasi tentang bagaimana galaksi cenderung dikelompokkan secara terstruktur daripada didistribusikan secara acak. Proses komputasi Galactos melibatkan tiga langkah utama. Di sekitar sebuah galaksi primer yang dipilih, algoritma akan terlebih dahulu mengumpulkan semua galaksi tetangga (sekunder) dalam jarak maksimum Rmax dan memasukkannya ke dalam cangkang berbentuk lingkaran/bola. Kemudian memutar semua koordinat sehingga garis penglihatan ke arah galaksi primer dari sudut pandang pengamat berada di sepanjang sumbu z, dan mentransfer semua vektor pemisahan kedua dari primer ke dalam bingkai tersebut. Kemudian algoritma memperluas sudut anistropik dari galaksi dalam setiap tempat menjadi harmonik sferis, atau seperangkat fungsi matematika tertentu. Ekspansi ditunjukkan oleh bayangan di bagian ekspansi dari grafik. Harmonik sferis adalah pergerakan partikel dalam potensial terpusat sekitar titik asal koordinat, distribusi dari orientasi momentum sudut dinyatakan oleh kuadrat modulus dari keadaan eigen momentum sudut.

simulasi-proses-proyek-galactos-astronomi
Gambar 2: Simulasi proses yang digunakan dalam proyek Galactos.
Courtesy of Lawrence Berkeley National Laboratory.

Algoritma Galactos diparalelkan melintasi node dengan mengambil keseluruhan 2 miliar galaksi dalam rangkaian data dan memecahnya menjadi kotak yang lebih kecil menggunakan pohon algoritma k-d yang dikembangkan oleh Intel dan terbukti efisien. Node adalah salah satu titik sambungan, titik redistribusi, atau titik akhir komunikasi (beberapa terminal peralatan). Ada juga komponen pertukaran komponen lingkaran halo untuk memperluas kotak konstan sebesar 200 megaparsec (200 Mpc=300 juta tahun cahaya) di setiap sisi dan menarik semua galaksi yang berada di wilayah luas. Setiap node memiliki semua galaksi yang dibutuhkan untuk menentukan 3-titik fungsi korelasi penuh dan tidak perlu berkomunikasi dengan node lain sampai akhir.

Algoritma O(N2) Mempercepat Komputasi 3-titik Fungsi Korelasi

Galactos menggunakan algoritma O(N2) yang sangat terukur, yang awalnya dibuat oleh Zachary Slepian, salah satu kolega Einstein di Laboratorium Berkeley, bersama Daniel Einstein, penasihat PhD Slepian dan profesor astronomi di Universitas Harvard. Selain itu, tim menggunakan kumpulan algoritma optimal pohon k-d untuk melakukan partisi spasial galaksi. Brian Friesen (Laboratorium Berkeley, Konsultan HPC) dan Intel bekerja sama untuk mengoptimalkan kode agar bisa berjalan di semua 9.636 node superkomputer NERSC Cori.

Menurut Slepian, "Menghitung setiap kemungkinan dari segitiga yang dibentuk oleh satu set objek adalah tantangan menarik secara kombinatorial: ada sejumlah besar hasil perhitungan untuk probabilitas segitiga. Untuk objek N, ada opsi N untuk pilihan pertama, N-1 untuk yang kedua, dan N-2 untuk yang ketiga, yang mengarah ke segitiga N(N-1)(N-2). Jika jumlah objek benda sangat besar, berarti kira-kira N^3.

Kunci utama algoritma O(N2) terletak pada susunan ulang proses penghitungan untuk mengurangi penskalaan ke N2. Dalam prakteknya, berarti 500 kali lebih cepat daripada perhitungan biasa.

Algoritma mengeksploitasi fakta bahwa dalam kosmologi, ia ingin menempatkan hasil perhitungan dalam panjang sisi segitiga. Sebagai contoh, saya mungkin melaporkan hasil untuk segitiga dengan sisi pertama antara 30 dan 60 juta tahun cahaya dan sisi kedua antara 90 dan 120 juta tahun cahaya. Algoritma kami berhasil melakukan penempatan ini terlebih dahulu, jadi kita tidak harus membandingkan kombinasi tiga galaksi, namun membandingkan kombinasi setiap penempatan. Ada lebih sedikit bins daripada jumlah galaksi, jadi inilah penghematan besar dalam komputasi.

Algoritma melakukannya dengan menulis masalah menggunakan seperangkat fungsi matematis tertentu, atau basis, yang ideal untuk masalah ini. Basis kami memiliki simetri yang sama dengan pengelompokan galaksi dan dapat secara kompak mewakili informasi yang yang dikandung dalam pengelompokan. Selanjutnya, himpunan fungsi ini, yang disebut polinomial Legendre, dapat dipecah menjadi lingkaran harmonik sferis."

Optimalisasi dan Vektorisasi yang Digunakan dalam Proyek Galactos

Menurut Friesen, "Optimasi Galactos terdiri dari dua komponen, termasuk single node dan skala multi-node. Penskalaan multi-node menggunakan algoritma pohon k-d, yang merupakan pohon k-d multi-node dengan membangun Message Passing Interface (MPI) di dalamnya. Pohon k-d digunakan untuk mempartisi kumpulan data dari elemen data yang saling berdekatan untuk setiap memori penyimpanan lain. Di Galactos, pohon k-d membantu meningkatkan kinerja saat menentukan tetangga galaksi terdekat.

"Pohon k-d juga penting untuk keseimbangan beban komputasi antara node pada sistem," Friesen menambahkan. "Sebagian besar perhitungan Galactos dilakukan dalam sebuah node, jadi hanya ada sedikit komunikasi antar node. Jika terjadi ketidakseimbangan beban yang besar antar node, maka algoritma hanya menghitung secepat node paling lambat. Tim bekerja untuk membuat beban komputasi semaksimal mungkin antar node untuk meningkatkan kecepatan algoritma."

Mengaktifkan vektorisasi prosesor Intel Xeon Phi yang diperlukan untuk menyortir galaksi, pasangan galaksi yang dipisahkan oleh jarak yang sama berdampingan di dalam memori penyimpanan. Hal ini memungkinkan algoritma untuk menghitung sifat geometris dari banyak pasangan galaksi sekaligus menggunakan vektorisasi, daripada menghitung sifat masing-masing pasangan galaksi secara terpisah.

Untuk proyek Galactos, Intel mengoptimalkan kinerja dalam node tunggal Intel Xeon Phi yang dioperasikan pada superkomputer Cray XC40. Intel sebelumnya terlibat dalam perhitungan 2-titik fungsi korelasi dengan Laboratorium Berkeley. "Optimalisasi kami ke Galactos mencakup distribusi algoritma pohon k-d untuk mempartisi galaksi dan memungkinkan penghitungan cepat ke galaksi tetangga terdekat manapun dan penghitungan harmonik sferis di sekitar masing-masing galaksi. Langkah 2 adalah hambatan terbesar yang dihadapi dalam komputasi dan telah divektorisasi dari galaksi tetangga yang dipilih dengan beberapa galaksi yang sejajar dalam rangkaian komputasi yang berbeda. Kami menggunakan perangkat yang dikembangkan oleh Intel dan telah dioptimalkan untuk prosesor Intel Xeon Phi," kata ilmuwan Intel Narayanan Sundaram. Dalam semua perhitungan Galactos, kode dikompilasi menggunakan kompiler Intel C++ v17.0.1 menggunakan Cray MPI. Tim menjalankan kode dengan proses MPI tunggal per node penghitungan Intel Xeon Phi, dengan menggunakan 272 rangkaian per node (empat rangkaian per inti fisik).

Waktu yang Dibutuhkan Galactos untuk Menyelesaikan Hasil Uji Dataset Outer Rim

Pengujian galaksi mencakup pemecahan kinerja kode yang menjalankan dataset Outer Rim dengan 225.000 galaksi pada node tunggal. Kinerja node tunggal telah dioptimalkan untuk prosesor Intel Xeon Phi, mencapai 39 persen dari puncak, dengan penggunaan vektorisasi dan hirarki memori yang efisien. Galactos mencapai penskalaan yang hampir sempurna dan kuat, mencapai 5,06 PF yang berkelanjutan pada 9636 node.

penskalaan-rendah-kode-galactos-astronomi
Gambar 3: Penskalaan rendah kode Galactos di Cori, menggunakan dataset Outer Rim.
Courtesy of Lawrence Berkeley National Laboratory.

penskalaan-kuat-kode-galactos-astronomi
Gambar 4: Penskalaan kuat kode Galactos di Cori, menggunakan dataset Outer Rim.
Courtesy of Lawrence Berkeley National Laboratory.

Tim menjalankan lebih dari 9.636 node Galactos yang ada di sistem Cori, baik dalam presisi campuran maupun presisi ganda. (Dalam presisi campuran, pohon k-d dihitung dalam presisi tunggal dan yang lainnya dalam presisi ganda.) Waktu yang dibutuhkan untuk menyelesaikan perhitungan 3-titik fungsi korelasi bagi 2 miliar galaksi dengan presisi campuran adalah 982,4 detik (16,37 menit), sedangkan dalam presisi ganda murni, waktu yang dibutuhkan untuk menyelesaikannya adalah 1.070,6 detik (17,84 menit).

Galactos Membantu Penelitian Kosmologi Masa Depan

Prabhat menyatakan, "Sebagai ilmuwan komputer, banyak capaian prestasi yang telah kami raih dalam beberapa tahun karena bidang yang kami tekuni berubah dengan sangat cepat. Proyek Galactos mumpuni dalam perhitungan yang sebelumnya sulit dilakukan untuk dijalankan di superkomputer Cori hanya dalam waktu 20 menit. Saat LSST online, kode mampu mengolah dataset besar dalam satu atau dua hari. Proyek ini sangat memuaskan bagi tim, karena kami tidak hanya memecahkan masalah 3-titik fungsi korelasi untuk dataset terbesar yang tersedia pada tahun 2017, namun untuk dekade berikutnya dalam bidang astronomi. Seberapa sering Anda bisa mengajukan klaim seperti itu?"

Ditulis oleh: Linda Barney, www.hpcwire.com


#terimakasihgoogle

Komentar

Postingan populer dari blog ini

Diameter Bumi

Kredit: NASA, Apollo 17, NSSDC   Para kru misi Apollo 17 mengambil citra Bumi pada bulan Desember 1972 saat menempuh perjalanan dari Bumi dan Bulan. Gurun pasir oranye-merah di Afrika dan Arab Saudi terlihat sangat kontras dengan samudera biru tua dan warna putih dari formasi awan dan salju antartika.   Diameter khatulistiwa Bumi adalah  12.756 kilometer . Lantas bagaimana cara para ilmuwan menghitungnya? Kredit: Clementine,  Naval Research Laboratory .   Pada tahun 200 SM, akurasi perhitungan ukuran Bumi hanya berselisih 1% dengan perhitungan modern. Matematikawan, ahli geografi dan astronom Eratosthenes menerapkan gagasan Aristoteles, jika Bumi berbentuk bulat, posisi bintang-bintang di langit malam hari akan terlihat berbeda bagi para pengamat di lintang yang berbeda.   Eratosthenes mengetahui pada hari pertama musim panas, Matahari melintas tepat di atas Syene, Mesir. Saat siang hari pada hari yang sama, Eratosthenes mengukur perpindahan sudut Matahari dari atas kota Al

Apa Itu Kosmologi? Definisi dan Sejarah

Potret dari sebuah simulasi komputer tentang pembentukan struktur berskala masif di alam semesta, memperlihatkan wilayah seluas 100 juta tahun cahaya beserta gerakan koheren yang dihasilkan dari galaksi yang mengarah ke konsentrasi massa tertinggi di bagian pusat. Kredit: ESO Kosmologi adalah salah satu cabang astronomi yang mempelajari asal mula dan evolusi alam semesta, dari sejak Big Bang hingga saat ini dan masa depan. Menurut NASA, definisi kosmologi adalah “studi ilmiah tentang sifat alam semesta secara keseluruhan dalam skala besar.” Para kosmolog menyatukan konsep-konsep eksotis seperti teori string, materi gelap, energi gelap dan apakah alam semesta itu tunggal ( universe ) atau multisemesta ( multiverse ). Sementara aspek astronomi lainnya berurusan secara individu dengan objek dan fenomena kosmik, kosmologi menjangkau seluruh alam semesta dari lahir sampai mati, dengan banyak misteri di setiap tahapannya. Sejarah Kosmologi dan Astronomi Pemahaman manusia

Berapa Lama Satu Tahun di Planet-Planet Lain?

Jawaban Singkat Berikut daftar berapa lama waktu yang dibutuhkan oleh setiap planet di tata surya kita untuk menyelesaikan satu kali orbit mengitari Matahari (dalam satuan hari di Bumi): Merkurius: 88 hari Venus: 225 hari Bumi: 365 hari Mars: 687 hari Jupiter: 4.333 hari Saturnus: 10.759 hari Uranus: 30.687 hari Neptunus: 60.190 hari   Satu tahun di Bumi berlalu sekitar 365 hari 6 jam, durasi waktu yang dibutuhkan oleh Bumi untuk menyelesaikan satu kali orbit mengitari Matahari. Pelajari lebih lanjut tentang hal itu di artikel: Apa Itu Tahun Kabisat? Satu tahun diukur dari seberapa lama waktu yang dibutuhkan oleh sebuah planet untuk mengorbit bintang induk. Kredit: NASA/Terry Virts Semua planet di tata surya kita juga mengorbit Matahari. Durasi waktu satu tahun sangat tergantung dengan tempat mereka mengorbit. Planet yang mengorbit Matahari dari jarak yang lebih dekat daripada Bumi, lama satu tahunnya lebih pendek daripada Bumi. Sebaliknya planet yang