Selama beberapa dekade terakhir, dunia bisnis telah menghadapi banyak titik balik yang didorong oleh revolusi teknologi, dan F5 telah hadir untuk membantu pelanggan kami melalui titik-titik kritis ini.
Ketika organisasi mulai melaksanakan transformasi digital mereka, aplikasi menjadi inti dari bisnis, dan F5 memastikan aplikasi-aplikasi tersebut dapat disampaikan dan diamankan dalam skala besar. Baru-baru ini, ketika 5G menjanjikan untuk merevolusi dunia bisnis dengan kecepatan, layanan, dan keandalan yang belum pernah ada sebelumnya, F5 hadir untuk membantu perusahaan telekomunikasi dalam menerapkan inti 5G berbasis cloud dalam skala besar.
Sekarang, sekali lagi, kita berada di titik balik, mungkin yang terbesar yang dihadapi industri kami, saat organisasi mencari cara untuk memanfaatkan kekuatan AI. Saat pelanggan menerapkan teknologi transformatif ini, F5 membantu mereka membuka potensi penuh implementasi AI berskala besar mereka.
Kesulitan dalam Mencapai Kinerja Optimal
Peningkatan adopsi klaster AI mendorong transformasi menuju komputasi yang dipercepat. Mencoba menggunakan praktik yang sudah ada dalam komputasi umum, jaringan, keamanan, dan pemantauan sering kali mengarah pada ketidakefisienan, keterlambatan, dan biaya yang terus meningkat.
Kebutuhan pemrosesan data yang sangat besar dari AI memberikan tekanan besar pada infrastruktur jaringan tradisional, yang membuatnya sulit untuk mempertahankan kinerja optimal. Unit pemrosesan data NVIDIA BlueField (DPU) telah muncul sebagai solusi kunci. Dengan memindahkan dan mempercepat tugas jaringan dan keamanan berkecepatan tinggi—seperti pemrosesan paket, enkripsi, dan kompresi—BlueField-3 DPU memberikan konektivitas jaringan cloud yang optimal. Optimasi ini meningkatkan kinerja keseluruhan dan mempercepat akses Unit Pemrosesan Grafis (GPU) ke data.
Penyedia layanan dan perusahaan besar sedang membangun infrastruktur AI berskala besar atau “pabrik” AI, menggunakan platform komputasi terakselerasi NVIDIA untuk melakukan pelatihan dan inferensi model AI generatif dalam skala besar. Bisnis perlu memaksimalkan investasi mereka dalam pabrik AI, yang bisa sangat besar. Namun tanpa fondasi yang tepat, infrastruktur AI bisa kurang dimanfaatkan.
Mengelola Lalu Lintas yang Luas yang Dituju ke Server AI dengan Efisien
F5 BIG-IP Next for Kubernetes yang diterapkan di NVIDIA BlueField-3 DPU dirancang untuk mengatasi masalah ini. Solusi ini fokus pada pemindahan dan percepatan F5 BIG-IP Next Service Proxy untuk Kubernetes (SPK) di BlueField-3 DPU milik NVIDIA. Ini dibangun di atas kepemimpinan F5 dalam mengatasi tantangan pengiriman aplikasi dan keamanan yang kritis selama titik balik pasar utama, sambil memanfaatkan inovasi NVIDIA dalam komputasi terakselerasi dan jaringan berkinerja tinggi.
F5 BIG-IP Next SPK dikembangkan untuk memecahkan masalah yang dihadapi penyedia layanan dengan Kubernetes saat mereka beralih ke 5G. Infrastruktur 5G dibangun di atas arsitektur berbasis cloud dan terkontainer, dengan beban kerja kontainer yang dikelola menggunakan Kubernetes. Namun, Kubernetes awalnya tidak dirancang untuk menangani kasus penggunaan kompleks yang dibutuhkan di lingkungan 5G. BIG-IP Next SPK membantu perusahaan telekomunikasi menyesuaikan jaringan Kubernetes untuk infrastruktur 5G, memberi mereka visibilitas, kontrol, dan keamanan yang mereka butuhkan untuk secara dinamis mengskalakan jaringan 5G mereka. Selama beberapa tahun terakhir, penyedia layanan telah menggunakan BIG-IP untuk mewujudkan teknologi 5G untuk jutaan pelanggan.
Sama seperti BIG-IP Next SPK memainkan peran penting dalam memungkinkan 5G Core pada titik balik pasar sebelumnya, kini ia berkembang untuk mengatasi tantangan titik balik pasar AI dan pengiriman beban kerja AI, yang memiliki kesamaan dengan beban kerja 5G, namun melibatkan volume lalu lintas yang jauh lebih besar. Untuk memenuhi permintaan titik balik pasar baru ini, F5 meluncurkan BIG-IP Next untuk Kubernetes yang diterapkan di BlueField-3 DPU NVIDIA untuk mengelola lalu lintas yang sangat besar yang diarahkan ke server AI.
Solusi Ini Mengubah Pengiriman Aplikasi Modern untuk Memenuhi Permintaan AI Generatif
Ini adalah implementasi berbasis Kubernetes dari platform BIG-IP F5 yang menangani jaringan, keamanan, dan beban kerja pengaturan beban, duduk di titik pemisah antara klaster AI dan bagian lainnya dari pusat data. BIG-IP Next untuk Kubernetes memetakan ruang nama klaster AI ke penyewaan jaringan pusat data, memberikan keamanan yang tepat dan manajemen yang disederhanakan. Dengan memanfaatkan akselerator perangkat keras BlueField-3 DPU, BIG-IP Next untuk Kubernetes mempercepat berbagai layanan jaringan dan data, mengoptimalkan efisiensi energi dengan memindahkan sumber daya komputasi CPU.
Misalnya, pada acara Networking @Scale 2024 yang diadakan Meta awal tahun ini, mereka menyebutkan bahwa pelatihan model bahasa pembelajaran sumber terbuka mereka (LLM) Llama 3 terhambat oleh latensi jaringan, yang diatasi dengan menyesuaikan interaksi perangkat keras dan perangkat lunak. Pendekatan ini meningkatkan kinerja keseluruhan sebesar 10%. Meskipun 10% mungkin tampak sebagai peningkatan kecil, untuk model yang memerlukan waktu berbulan-bulan untuk dilatih, perbaikan ini berarti minggu-minggu yang diselamatkan.
Mengurangi Kompleksitas Implementasi AI
F5 BIG-IP Next untuk Kubernetes yang diterapkan di BlueField-3 DPU menawarkan berbagai manfaat bagi penyedia layanan dan perusahaan besar yang ingin membangun infrastruktur AI berskala besar. Beberapa manfaat ini meliputi:
- Integrasi yang Disederhanakan: Hingga saat ini, organisasi menghadapi kompleksitas dalam merakit komponen perangkat lunak dari vendor yang berbeda untuk mengirimkan dan mengamankan aplikasi AI mereka. BIG-IP Next untuk Kubernetes menggabungkan jaringan, keamanan, manajemen lalu lintas, dan pengaturan beban dalam satu solusi, menyederhanakan kompleksitas implementasi AI. Ini juga menawarkan tampilan terintegrasi dari fungsi-fungsi ini di seluruh infrastruktur AI, bersama dengan observabilitas yang kaya dan kontrol granular yang dibutuhkan untuk mengoptimalkan beban kerja AI.
- Keamanan yang Ditingkatkan: BIG-IP Next untuk Kubernetes mendukung fitur keamanan kritis dan arsitektur zero trust, termasuk firewall tepi, mitigasi Distributed Denial-of-Service (DDoS), perlindungan API, pencegahan intrusi, enkripsi, dan manajemen sertifikat—memindahkan fungsi-fungsi ini ke DPU dan membebaskan sumber daya CPU yang berharga.
- Kinerja yang Ditingkatkan: BIG-IP Next untuk Kubernetes mempercepat jaringan dan keamanan, yang sangat penting untuk memenuhi permintaan yang dibutuhkan oleh infrastruktur AI dalam pengiriman aplikasi di skala cloud.
- Dukungan Multi-Tenancy: BIG-IP Next untuk Kubernetes memungkinkan arsitektur multi-tenant sehingga penyedia layanan dapat menghosting beberapa pengguna secara aman di infrastruktur AI yang sama, sambil menjaga beban kerja dan data AI mereka terpisah.
Berhasil Mengirimkan Pusat Data yang Dioptimalkan untuk AI
Dengan mempertimbangkan tantangan dan solusi yang tersedia, organisasi dapat berhasil mengirimkan pusat data yang dioptimalkan untuk AI tanpa mengganggu operasi yang ada atau mengorbankan keamanan. F5 BIG-IP Next untuk Kubernetes yang diterapkan di BlueField-3 DPU muncul sebagai opsi yang sangat menarik, memberikan integrasi yang mulus, keamanan yang ditingkatkan, dan kinerja yang lebih baik untuk beban kerja AI, termasuk LLM berskala besar seperti Llama 3.
