F5 BIG-IP Next for Kubernetes, proxy cerdas baru dari F5, yang dipadukan dengan NVIDIA BlueField-3 DPU, mengubah pengiriman aplikasi untuk beban kerja AI SEATTLE – F5 (NASDAQ: FFIV) hari ini mengumumkan ketersediaan BIG-IP Next for Kubernetes, solusi pengiriman dan keamanan aplikasi AI inovatif yang memberi penyedia layanan dan perusahaan besar titik kontrol terpusat untuk mempercepat, mengamankan, dan menyederhanakan lalu lintas data yang masuk dan keluar dari infrastruktur AI berskala besar. Solusi ini memanfaatkan kekuatan NVIDIA BlueField-3 DPU yang berkinerja tinggi untuk meningkatkan efisiensi lalu lintas pusat data yang sangat penting untuk penerapan AI berskala besar. Dengan tampilan terintegrasi dari jaringan, manajemen lalu lintas, dan keamanan, pelanggan akan dapat memaksimalkan pemanfaatan sumber daya pusat data sambil mencapai kinerja aplikasi AI yang optimal. Hal ini tidak hanya meningkatkan efisiensi infrastruktur tetapi juga memungkinkan inferensi AI yang lebih cepat dan responsif, yang pada akhirnya memberikan pengalaman pelanggan berbasis AI yang lebih baik. F5 BIG-IP Next for Kubernetes adalah solusi yang dirancang khusus untuk lingkungan Kubernetes yang telah terbukti di infrastruktur cloud dan 5G berskala besar untuk perusahaan telekomunikasi. Dengan BIG-IP Next for Kubernetes, teknologi ini kini disesuaikan untuk kasus penggunaan AI terkemuka seperti inferensi, generasi yang ditingkatkan dengan pengambilan (RAG), serta manajemen dan penyimpanan data yang mulus. Integrasi dengan NVIDIA BlueField-3 DPU meminimalkan jejak perangkat keras, memungkinkan multi-tenancy granular, dan mengoptimalkan konsumsi energi sambil memberikan jaringan berkinerja tinggi, keamanan, dan manajemen lalu lintas. Kombinasi teknologi F5 dan NVIDIA memungkinkan penyedia layanan telekomunikasi seluler dan tetap untuk mempermudah transisi ke infrastruktur berbasis cloud-native (Kubernetes), menangani permintaan yang terus berkembang agar vendor dapat menyesuaikan fungsinya dengan model cloud-native network functions (CNFs). F5 BIG-IP Next for Kubernetes memindahkan tugas-tugas berbasis data berat ke BlueField-3 DPU, membebaskan sumber daya CPU untuk aplikasi yang menghasilkan pendapatan. Solusi ini sangat bermanfaat di tepi jaringan untuk virtualized RAN (vRAN) atau DAA untuk MSO, dan di jaringan inti untuk 5G, membuka potensi masa depan untuk 6G. Dirancang khusus untuk penyedia layanan dengan permintaan tinggi dan infrastruktur berskala besar, F5 BIG-IP Next for Kubernetes: Menyederhanakan pengiriman layanan AI di skala cloud: BIG-IP Next for Kubernetes terintegrasi mulus dengan jaringan depan pelanggan, secara signifikan mengurangi latensi sambil memberikan pengaturan beban berkinerja tinggi untuk menangani permintaan data besar dari model AI multi-miliar parameter dan triliunan operasi. Meningkatkan kontrol penerapan AI: Solusi ini menawarkan titik integrasi terpusat ke jaringan AI modern dengan observabilitas yang kaya dan informasi yang sangat terperinci. BIG-IP Next for Kubernetes mendukung beberapa protokol L7 selain HTTP, memastikan kontrol masuk dan keluar yang lebih baik dengan kinerja sangat tinggi. Melindungi lanskap AI yang baru: Pelanggan dapat sepenuhnya mengotomatiskan penemuan dan keamanan titik akhir pelatihan dan inferensi AI. BIG-IP Next for Kubernetes juga mengisolasi aplikasi AI dari ancaman yang ditargetkan, memperkuat integritas dan kedaulatan data sambil menangani kemampuan enkripsi yang penting untuk lingkungan AI modern. Ketersediaan BIG-IP Next for Kubernetes yang berjalan di NVIDIA BlueField-3 DPU akan dimulai pada bulan November. Kutipan Pendukung: “Proliferasi AI telah memicu permintaan yang belum pernah terjadi sebelumnya untuk semikonduktor dan teknologi canggih. Organisasi sedang membangun pabrik AI, lingkungan yang sangat dioptimalkan untuk melatih model AI besar dan memberikan daya pemrosesan yang diperlukan untuk skala inferensi dengan kecepatan luar biasa, dan dengan latensi minimal. Sinergi antara layanan pengiriman aplikasi dan keamanan F5 yang kuat dan komputasi terakselerasi NVIDIA menciptakan ekosistem yang kuat. Integrasi ini memberikan pelanggan observabilitas yang lebih baik, kontrol granular, dan kinerja yang dioptimalkan untuk beban kerja AI mereka di seluruh tumpukan, dari lapisan akselerasi perangkat keras hingga antarmuka aplikasi.” – Kunal Anand, Chief Technology and AI Officer di F5 “Penyedia layanan dan perusahaan memerlukan komputasi terakselerasi untuk mengirimkan aplikasi AI berkinerja tinggi secara aman dan efisien di skala cloud. NVIDIA bekerja dengan F5 untuk mempercepat pengiriman aplikasi AI, memastikan efisiensi puncak dan pengalaman pengguna yang mulus yang didukung oleh BlueField-3 DPU.” – Ash Bhalgat, Sr. Director AI Networking and Security Partnerships di NVIDIA “Mewujudkan potensi AI memerlukan kemampuan pemrosesan data lebih banyak dari yang dipersiapkan industri sebelumnya. Bagi banyak perusahaan, menerapkan AI mutakhir memerlukan pembangunan infrastruktur besar yang sangat kompleks dan mahal, sehingga operasi yang efisien dan aman lebih penting dari sebelumnya. F5 BIG-IP Next for Kubernetes mengatasi masalah kinerja dan keamanan untuk infrastruktur AI berskala besar. Dengan memberikan manajemen lalu lintas yang dioptimalkan, organisasi mendapatkan kinerja pengambilan data yang lebih baik dan pemanfaatan server saat inferensi model AI. Ini menghasilkan pengalaman pelanggan yang sangat ditingkatkan bagi pengguna aplikasi AI.” – Kuba Stolarski, Research Vice President, Computing Systems Research Practice di IDC Ledakan beban kerja AI telah menciptakan gelombang permintaan baru untuk kontrol yang skalabel, teroptimalkan, dan ditingkatkan atas ingress dan egress Kubernetes. Dengan F5 kini menyampaikan manfaat yang telah terbukti dari BIG-IP Next for Kubernetes langsung di NVIDIA BlueField-3 DPU, ini membuka teknologi yang sudah terbukti yang kini dapat diterapkan pada titik penyisipan yang ideal untuk penerapan AI berskala besar. Klien WWT akan dapat merasakan manfaat dari kinerja pengambilan data dan pemanfaatan GPU yang lebih baik selama pelatihan model serta pengalaman pengguna yang lebih baik selama inferensi, sambil mendapatkan titik kontrol strategis untuk layanan keamanan. Teknologi dari F5 dan NVIDIA—dua kemitraan strategis kami—lebih lanjut memperkuat misi global kami dalam memberikan keamanan digital yang unggul.” – Todd Hathaway, Global Practice Manager, AI, App, and API Security Solutions di WWT
Month: January 2025
F5 Membantu Penyedia Layanan dan Perusahaan Membuka Potensi Penuh Implementasi AI dengan NVIDIA BlueField-3 DPU
Selama beberapa dekade terakhir, dunia bisnis telah menghadapi banyak titik balik yang didorong oleh revolusi teknologi, dan F5 telah hadir untuk membantu pelanggan kami melalui titik-titik kritis ini. Ketika organisasi mulai melaksanakan transformasi digital mereka, aplikasi menjadi inti dari bisnis, dan F5 memastikan aplikasi-aplikasi tersebut dapat disampaikan dan diamankan dalam skala besar. Baru-baru ini, ketika 5G menjanjikan untuk merevolusi dunia bisnis dengan kecepatan, layanan, dan keandalan yang belum pernah ada sebelumnya, F5 hadir untuk membantu perusahaan telekomunikasi dalam menerapkan inti 5G berbasis cloud dalam skala besar. Sekarang, sekali lagi, kita berada di titik balik, mungkin yang terbesar yang dihadapi industri kami, saat organisasi mencari cara untuk memanfaatkan kekuatan AI. Saat pelanggan menerapkan teknologi transformatif ini, F5 membantu mereka membuka potensi penuh implementasi AI berskala besar mereka. Kesulitan dalam Mencapai Kinerja Optimal Peningkatan adopsi klaster AI mendorong transformasi menuju komputasi yang dipercepat. Mencoba menggunakan praktik yang sudah ada dalam komputasi umum, jaringan, keamanan, dan pemantauan sering kali mengarah pada ketidakefisienan, keterlambatan, dan biaya yang terus meningkat. Kebutuhan pemrosesan data yang sangat besar dari AI memberikan tekanan besar pada infrastruktur jaringan tradisional, yang membuatnya sulit untuk mempertahankan kinerja optimal. Unit pemrosesan data NVIDIA BlueField (DPU) telah muncul sebagai solusi kunci. Dengan memindahkan dan mempercepat tugas jaringan dan keamanan berkecepatan tinggi—seperti pemrosesan paket, enkripsi, dan kompresi—BlueField-3 DPU memberikan konektivitas jaringan cloud yang optimal. Optimasi ini meningkatkan kinerja keseluruhan dan mempercepat akses Unit Pemrosesan Grafis (GPU) ke data. Penyedia layanan dan perusahaan besar sedang membangun infrastruktur AI berskala besar atau “pabrik” AI, menggunakan platform komputasi terakselerasi NVIDIA untuk melakukan pelatihan dan inferensi model AI generatif dalam skala besar. Bisnis perlu memaksimalkan investasi mereka dalam pabrik AI, yang bisa sangat besar. Namun tanpa fondasi yang tepat, infrastruktur AI bisa kurang dimanfaatkan. Mengelola Lalu Lintas yang Luas yang Dituju ke Server AI dengan Efisien F5 BIG-IP Next for Kubernetes yang diterapkan di NVIDIA BlueField-3 DPU dirancang untuk mengatasi masalah ini. Solusi ini fokus pada pemindahan dan percepatan F5 BIG-IP Next Service Proxy untuk Kubernetes (SPK) di BlueField-3 DPU milik NVIDIA. Ini dibangun di atas kepemimpinan F5 dalam mengatasi tantangan pengiriman aplikasi dan keamanan yang kritis selama titik balik pasar utama, sambil memanfaatkan inovasi NVIDIA dalam komputasi terakselerasi dan jaringan berkinerja tinggi. F5 BIG-IP Next SPK dikembangkan untuk memecahkan masalah yang dihadapi penyedia layanan dengan Kubernetes saat mereka beralih ke 5G. Infrastruktur 5G dibangun di atas arsitektur berbasis cloud dan terkontainer, dengan beban kerja kontainer yang dikelola menggunakan Kubernetes. Namun, Kubernetes awalnya tidak dirancang untuk menangani kasus penggunaan kompleks yang dibutuhkan di lingkungan 5G. BIG-IP Next SPK membantu perusahaan telekomunikasi menyesuaikan jaringan Kubernetes untuk infrastruktur 5G, memberi mereka visibilitas, kontrol, dan keamanan yang mereka butuhkan untuk secara dinamis mengskalakan jaringan 5G mereka. Selama beberapa tahun terakhir, penyedia layanan telah menggunakan BIG-IP untuk mewujudkan teknologi 5G untuk jutaan pelanggan. Sama seperti BIG-IP Next SPK memainkan peran penting dalam memungkinkan 5G Core pada titik balik pasar sebelumnya, kini ia berkembang untuk mengatasi tantangan titik balik pasar AI dan pengiriman beban kerja AI, yang memiliki kesamaan dengan beban kerja 5G, namun melibatkan volume lalu lintas yang jauh lebih besar. Untuk memenuhi permintaan titik balik pasar baru ini, F5 meluncurkan BIG-IP Next untuk Kubernetes yang diterapkan di BlueField-3 DPU NVIDIA untuk mengelola lalu lintas yang sangat besar yang diarahkan ke server AI. Solusi Ini Mengubah Pengiriman Aplikasi Modern untuk Memenuhi Permintaan AI Generatif Ini adalah implementasi berbasis Kubernetes dari platform BIG-IP F5 yang menangani jaringan, keamanan, dan beban kerja pengaturan beban, duduk di titik pemisah antara klaster AI dan bagian lainnya dari pusat data. BIG-IP Next untuk Kubernetes memetakan ruang nama klaster AI ke penyewaan jaringan pusat data, memberikan keamanan yang tepat dan manajemen yang disederhanakan. Dengan memanfaatkan akselerator perangkat keras BlueField-3 DPU, BIG-IP Next untuk Kubernetes mempercepat berbagai layanan jaringan dan data, mengoptimalkan efisiensi energi dengan memindahkan sumber daya komputasi CPU. Misalnya, pada acara Networking @Scale 2024 yang diadakan Meta awal tahun ini, mereka menyebutkan bahwa pelatihan model bahasa pembelajaran sumber terbuka mereka (LLM) Llama 3 terhambat oleh latensi jaringan, yang diatasi dengan menyesuaikan interaksi perangkat keras dan perangkat lunak. Pendekatan ini meningkatkan kinerja keseluruhan sebesar 10%. Meskipun 10% mungkin tampak sebagai peningkatan kecil, untuk model yang memerlukan waktu berbulan-bulan untuk dilatih, perbaikan ini berarti minggu-minggu yang diselamatkan. Mengurangi Kompleksitas Implementasi AI F5 BIG-IP Next untuk Kubernetes yang diterapkan di BlueField-3 DPU menawarkan berbagai manfaat bagi penyedia layanan dan perusahaan besar yang ingin membangun infrastruktur AI berskala besar. Beberapa manfaat ini meliputi: Integrasi yang Disederhanakan: Hingga saat ini, organisasi menghadapi kompleksitas dalam merakit komponen perangkat lunak dari vendor yang berbeda untuk mengirimkan dan mengamankan aplikasi AI mereka. BIG-IP Next untuk Kubernetes menggabungkan jaringan, keamanan, manajemen lalu lintas, dan pengaturan beban dalam satu solusi, menyederhanakan kompleksitas implementasi AI. Ini juga menawarkan tampilan terintegrasi dari fungsi-fungsi ini di seluruh infrastruktur AI, bersama dengan observabilitas yang kaya dan kontrol granular yang dibutuhkan untuk mengoptimalkan beban kerja AI. Keamanan yang Ditingkatkan: BIG-IP Next untuk Kubernetes mendukung fitur keamanan kritis dan arsitektur zero trust, termasuk firewall tepi, mitigasi Distributed Denial-of-Service (DDoS), perlindungan API, pencegahan intrusi, enkripsi, dan manajemen sertifikat—memindahkan fungsi-fungsi ini ke DPU dan membebaskan sumber daya CPU yang berharga. Kinerja yang Ditingkatkan: BIG-IP Next untuk Kubernetes mempercepat jaringan dan keamanan, yang sangat penting untuk memenuhi permintaan yang dibutuhkan oleh infrastruktur AI dalam pengiriman aplikasi di skala cloud. Dukungan Multi-Tenancy: BIG-IP Next untuk Kubernetes memungkinkan arsitektur multi-tenant sehingga penyedia layanan dapat menghosting beberapa pengguna secara aman di infrastruktur AI yang sama, sambil menjaga beban kerja dan data AI mereka terpisah. Berhasil Mengirimkan Pusat Data yang Dioptimalkan untuk AI Dengan mempertimbangkan tantangan dan solusi yang tersedia, organisasi dapat berhasil mengirimkan pusat data yang dioptimalkan untuk AI tanpa mengganggu operasi yang ada atau mengorbankan keamanan. F5 BIG-IP Next untuk Kubernetes yang diterapkan di BlueField-3 DPU muncul sebagai opsi yang sangat menarik, memberikan integrasi yang mulus, keamanan yang ditingkatkan, dan kinerja yang lebih baik untuk beban kerja AI, termasuk LLM berskala besar seperti Llama 3.
Epic dan F5 Pastikan Pengiriman Data Pasien yang Aman untuk Sistem Perawatan Medis Terkemuka di Swiss
Dari mengamankan informasi kesehatan pribadi (PHI) hingga mencegah pelanggaran keamanan siber dan meningkatkan kinerja jaringan, F5 telah berada di garis depan membantu dunia medis berkembang—dan kemitraan kesehatan kami dengan Epic, penyedia perangkat lunak perawatan kesehatan terkemuka, adalah bagian penting dari ekosistem tersebut. Dengan bekerja sama untuk melindungi kinerja dan keamanan aplikasi perawatan kesehatan, F5 dan Epic memastikan penyedia layanan kesehatan dapat memberikan perawatan yang sangat baik. Salah satu contoh terbaru adalah bagaimana kami bergabung untuk membantu sistem perawatan medis terkemuka di Swiss mengatasi tantangan IT besar. Infrastruktur load balancing yang sudah usang pada sistem perawatan medis ini menyebabkan ketidakstabilan jaringan, tepat saat sistem tersebut akan beralih ke sistem baru dengan tenggat waktu yang ketat. Gagal menyelesaikan masalah ini akan membahayakan perawatan pasien dan membuat perusahaan terpapar potensi ketidakpatuhan regulasi. Ketidakstabilan jaringan ini terjadi pada saat yang paling buruk. Dengan peluncuran sistem yang sangat penting semakin dekat, infrastruktur yang ada tidak dapat menangani tuntutan IT perawatan kesehatan modern. Ketidakstabilan jaringan ini mengancam untuk mengganggu layanan medis penting, dan taruhannya sangat tinggi—penundaan atau downtime dapat mempengaruhi perawatan pasien dan melanggar hukum privasi seperti HIPAA dan Peraturan Perlindungan Data Umum (GDPR). Membangun Infrastruktur yang Tangguh dengan Cepat F5 BIG-IP Application Services Templates (FAST), yang menyediakan cara mudah dan efektif untuk menyebarkan aplikasi pada sistem BIG-IP, menjadi kunci untuk menyelesaikan masalah ini. Dengan menerapkan BIG-IP FAST, sistem perawatan kesehatan tersebut dengan cepat mengonfigurasi solusi load balancing baru yang menstabilkan jaringan dan mendukung transisi sistem. BIG-IP FAST memungkinkan organisasi untuk: Mengonfigurasi Load Balancer dengan Cepat: Template yang sudah dibangun sebelumnya memungkinkan penyedia Swiss untuk menyiapkan infrastruktur yang tangguh dengan cepat, mengurangi kompleksitas konfigurasi manual, dan menghemat waktu penting. Mengamankan Data Pasien: Template BIG-IP FAST mengintegrasikan enkripsi dan kontrol akses, memastikan data medis sensitif terlindungi selama transisi. Menjamin Kepatuhan: Dengan dukungan bawaan untuk standar regulasi, BIG-IP FAST membantu penyedia mempertahankan kepatuhan dengan regulasi lokal dan internasional, menghindari potensi konsekuensi hukum dan finansial. Menyelesaikan Tantangan Jaringan dan Keamanan yang Krusial Salah satu tantangan krusial yang diselesaikan dengan BIG-IP FAST adalah ketidakstabilan jaringan. Transisi ini membutuhkan load balancing yang stabil dan aman, dan BIG-IP FAST memastikan penyedia perawatan kesehatan dapat mengimplementasikannya dengan cepat, menjaga jaringan tetap berjalan tanpa gangguan. Keamanan juga menjadi perhatian utama. Dengan BIG-IP FAST, organisasi menerapkan konfigurasi aman yang melindungi data pasien dari ancaman siber, sangat penting di lingkungan yang semakin sering menjadi target serangan ransomware. Template BIG-IP FAST menyederhanakan proses untuk mematuhi peraturan data yang kompleks seperti HIPAA dan GDPR, mengurangi risiko denda yang mahal dan kerusakan reputasi. Transisi yang Mulus Tanpa Downtime Dengan BIG-IP FAST, penyedia medis Swiss memenuhi tenggat waktu go-live mereka, menghindari gangguan yang dapat memengaruhi perawatan pasien. Jaringan distabilkan, sistem baru berhasil diterapkan, dan data sensitif tetap aman sepanjang proses. Kisah sistem perawatan medis Swiss ini menunjukkan sinergi yang kuat antara upaya bersama Epic dan F5, terutama di lingkungan yang penuh tantangan di mana keamanan dan garis waktu operasional sangat penting. Ini juga menunjukkan nilai praktis dari F5 BIG-IP FAST dalam lingkungan yang penuh risiko dan sensitif terhadap waktu. Dengan menyederhanakan proses penyebaran dan meningkatkan keamanan, BIG-IP FAST terbukti penting dalam membantu penyedia perawatan kesehatan besar melewati transisi krusial tanpa mengorbankan perawatan pasien.
Memperkenalkan Asisten AI untuk F5 Distributed Cloud Services
F5 memperkenalkan asisten baru yang didorong oleh AI dalam F5 Distributed Cloud Services, solusi keamanan, jaringan, dan manajemen aplikasi berbasis SaaS kami. Seiring dengan berkembangnya penggunaan Distributed Cloud Services oleh pelanggan, kompleksitas dan upaya yang terlibat dalam penyampaian, pengamanan, dan pengoperasian aplikasi dapat meningkat seiring dengan bertambahnya jumlah aplikasi yang diterapkan di konsol. Untuk lebih mendukung misi kami dalam membuat keamanan dan pengiriman aplikasi skala besar menjadi sangat mudah, F5 telah mengembangkan asisten AI untuk F5 Distributed Cloud Console. Asisten AI ini memberdayakan pelanggan untuk meningkatkan penggunaan platform dalam mengamankan dan mengirimkan aplikasi dan API terdistribusi mereka di lingkungan hibrida dan multicloud. Dikembangkan untuk tim keamanan, jaringan, dan keandalan situs Asisten AI baru ini membawa beberapa kemampuan cerdas untuk menyederhanakan manajemen dan keamanan aplikasi serta API menggunakan antarmuka bahasa alami, termasuk: Wawasan waktu nyata: Meningkatkan keamanan aplikasi dan kesehatan situs dengan visibilitas terkini mengenai situs hibrida dan multicloud, memastikan praktisi keamanan dan jaringan dapat dengan cepat mendeteksi dan merespons ancaman yang muncul, menjaga postur keamanan yang kuat. Penyederhanaan: Memanfaatkan kemampuan penyederhanaan canggih untuk mengubah volume data yang besar menjadi laporan yang jelas dan ringkas. Ini memungkinkan tim untuk lebih memahami informasi yang kompleks dan kejadian keamanan canggih untuk membuat keputusan yang lebih terinformasi tanpa harus menyaring data yang berlebihan. Rekomendasi yang dapat ditindaklanjuti: Memberikan rekomendasi yang dapat ditindaklanjuti, memungkinkan pengguna untuk dengan cepat menangani ancaman yang teridentifikasi, masalah kinerja, status kesehatan jaringan, dan kerentanannya. Dengan membimbing pengguna melalui langkah-langkah yang diperlukan, asisten AI membantu meningkatkan keamanan secara keseluruhan dan mempercepat operasi respons insiden. Peningkatan operasional dan efisiensi: Mengotomatiskan dan menyederhanakan tugas keamanan dan jaringan yang kompleks untuk meningkatkan efisiensi operasional secara signifikan. Hal ini memungkinkan tim SecOps dan NetOps untuk fokus pada inisiatif strategis, mengurangi beban kerja, dan mengoptimalkan alokasi sumber daya. Untuk respons keamanan kritis seperti kerentanannya zero-day, asisten AI mempercepat respons insiden dengan kemampuan deteksi dan mitigasi yang cepat. Ketika ancaman zero-day muncul, praktisi keamanan dapat menanyakan informasi ancaman yang relevan pada asisten AI. Asisten AI membimbing pengguna ke tampilan analitik keamanan, di mana tim dapat dengan cepat mengidentifikasi dan menganalisis pola lalu lintas berbahaya. Dengan rekomendasi yang dapat ditindaklanjuti, pengguna dapat menerapkan langkah perlindungan seperti memblokir alamat IP jahat menggunakan kebijakan layanan. Proses efisien ini secara signifikan mengurangi waktu respons dari hari menjadi menit, memastikan perlindungan aset penting dan meminimalkan potensi kerusakan. Mulai menggunakan asisten AI hari ini Pelanggan Distributed Cloud Services yang ada dapat mengakses asisten AI hari ini langsung dari konsol. Bagi mereka yang baru mengenal F5 Distributed Cloud Platform, jelajahi kekuatan dan efisiensi alur kerja tambahan dari asisten AI dengan demo interaktif. Solusi perlindungan aplikasi web dan API terkemuka (WAAP) serta jaringan multicloud aman F5 membuka lebih banyak kemampuan dengan asisten AI, menyediakan bantuan bahasa alami untuk tugas keamanan dan jaringan yang paling kritis. Apa yang akan datang? F5 berkomitmen untuk memperluas integrasi AI-nya, meningkatkan analitik prediktif, respons insiden otomatis, dan pengalaman pengguna yang dipersonalisasi. Dengan mengintegrasikan model AI generatif dengan solusi keamanan dan pengiriman aplikasi terkemuka kami, F5 membantu pelanggan di mana pun mereka berada dalam perjalanan AI mereka. Dari deteksi ancaman cerdas hingga optimisasi jaringan otomatis dan keamanan dinamis, nantikan lebih banyak inovasi berbasis AI yang menjanjikan untuk meningkatkan efisiensi dan keamanan di lanskap digital.
F5 Membantu Anda Mengatasi Persyaratan Baru PCI DSS v4.0
Pada Maret 2022, Payment Card Industry (PCI) Security Standards Council (SSC) merilis versi terbaru dari Data Security Standard-nya, PCI DSS v4.0, dan secara resmi menghentikan PCI DSS v3.2.1 pada akhir Maret 2024. PCI DSS adalah standar global yang menetapkan persyaratan keamanan teknis dan operasional minimum untuk kepatuhan oleh organisasi mana pun yang menyimpan, memproses, atau mentransmisikan data kartu pembayaran. Menandakan kemajuan besar dalam keamanan data kartu pembayaran dengan merancang fleksibilitas dan kontrol risiko yang lebih besar dibandingkan dengan versi sebelumnya, PCI DSS v4.0 dan pembaruannya (versi terbaru dari standar PCI DSS adalah v4.0.1) memberikan praktik terbaik bagi organisasi untuk diikuti. Namun, dalam waktu sedikit lebih dari 3 bulan (setelah 31 Maret 2025), “praktik terbaik” PCI DSS v4.x ini akan beralih menjadi persyaratan yang akan diterapkan pada setiap penilaian PCI DSS. PCI DSS v4.x menekankan pentingnya mengamankan data pemegang kartu yang sensitif sepanjang siklus hidup kartu pembayaran. Mengharuskan enkripsi, baik data pemegang kartu dalam perjalanan maupun saat istirahat, menekankan pentingnya transaksi pembayaran dan perlindungan data sambil memberikan pertahanan preventif terhadap ancaman yang muncul. PCI DSS dan WAFs Dalam PCI DSS v3.2.1, organisasi memiliki opsi untuk melindungi aplikasi web yang menghadap publik secara manual atau dengan alat penilaian keamanan kerentanannya otomatis setidaknya setiap tahun atau setelah perubahan signifikan pada aplikasi. Atau mereka dapat memilih untuk memasang solusi otomatis di depan aplikasi web yang menghadap publik untuk terus mendeteksi dan mencegah serangan berbasis web, yang dikonfigurasi untuk memblokir atau menghasilkan peringatan tentang serangan. Namun, PCI DSS v4.x akan mengharuskan organisasi untuk menerapkan solusi di depan aplikasi web yang menghadap publik untuk terus mendeteksi, mencegah, dan menghasilkan peringatan tentang serangan berbasis web (PCI DSS v4.0 subbagian 6.4.2). Itulah yang dilakukan oleh web application firewall (WAF). WAF dipasang di depan aplikasi yang menghadap publik untuk memeriksa lalu lintas aplikasi, mendeteksi dan melindungi terhadap serangan berbasis web. WAF mencegah serangan pada lapisan aplikasi, termasuk serangan yang dapat mengeksploitasi kerentanannya yang umum dan tidak diketahui dalam aplikasi dan rantai pasokan perangkat lunaknya—kode inti, pustaka pihak ketiga, alat bangun, dan kode lainnya yang menyusun aplikasi kompleks dan canggih saat ini. WAF juga melindungi terhadap serangan yang berusaha mengeksploitasi kelemahan implementasi atau konfigurasi serta serangan otomatis terhadap pembayaran, kredensial, dan aplikasi yang terpasang. Bagaimana F5 Dapat Membantu F5 mengamankan aplikasi dan API mana saja, di mana saja. Solusi WAF kami dapat diterapkan di depan aplikasi mana pun, terlepas dari tempat aplikasi tersebut berada. Apakah Anda memerlukan WAF untuk melindungi aplikasi yang berada di tempat atau di pusat data atau di cloud, F5 memiliki solusi WAF yang akan memberikan keamanan lapisan aplikasi yang komprehensif dan perlindungan dari eksploitasi dan serangan. F5 WAF tersedia sebagai perangkat keras, perangkat lunak, atau di cloud melalui layanan mandiri atau layanan terkelola, mengamankan aplikasi yang dikontainerisasi dan Kubernetes, dan lainnya. Produk F5 telah disertifikasi sebagai penyedia layanan PCI DSS Level 1. Penyedia layanan, sebagaimana didefinisikan oleh PCI SSC, adalah organisasi yang tidak menyediakan kartu pembayaran bermerek atau bentuk lainnya, tetapi memproses, menyimpan, atau mentransmisikan data pemegang kartu atau data otentikasi sensitif untuk organisasi lain. Perusahaan yang memberikan layanan untuk mengontrol atau mempengaruhi keamanan data pemegang kartu atau data otentikasi sensitif, seperti F5 melalui F5 Distributed Cloud Services, juga diklasifikasikan sebagai penyedia layanan PCI DSS v4.0. F5 membantu pelanggan kami memenuhi persyaratan PCI DSS sebagai pedagang, yang didefinisikan oleh PCI SSC sebagai entitas mana pun yang menerima kartu pembayaran yang menampilkan logo dari merek pembayaran yang berpartisipasi sebagai pembayaran untuk barang dan/atau layanan. F5 Distributed Cloud Services menyediakan berbagai layanan yang menangani banyak bagian dan subbagian dari standar PCI DSS v4.0 untuk organisasi yang menyimpan, memproses, atau mentransmisikan data kartu pembayaran. F5 Distributed Cloud WAF mengamankan aplikasi di mana saja—melintasi cloud, pusat data, dan lokasi edge. Sebagai proxy perantara, Distributed Cloud WAF memeriksa permintaan dan respons aplikasi, memblokir dan mengurangi risiko, termasuk kategori OWASP Top 10, kampanye ancaman, pengguna jahat, ancaman DDoS lapisan 7, bot, dan serangan otomatis, untuk menyebutkan beberapa. Ini mengurangi serangan aplikasi web dan kerentanannya melalui kontrol keamanan dan kebijakan yang komprehensif dan konsisten, dengan pengamatan yang mudah untuk dikonfigurasi, diterapkan, dikelola, dan diskalakan. F5 Distributed Cloud WAF mengintegrasikan perlindungan ke dalam proses pengembangan aplikasi Anda, memungkinkan siklus pengiriman dan rilis aplikasi yang lebih cepat dan lebih aman. Dengan menggunakan teknik deteksi berbasis tanda tangan dan AI dengan penyesuaian tanda tangan otomatis, F5 Distributed Cloud WAF memberikan keamanan lapisan aplikasi yang cepat dan sederhana dengan efektivitas maksimum. Asisten AI baru dalam Distributed Cloud Services membantu menyederhanakan keamanan untuk aplikasi dan API yang tersebar melalui antarmuka bahasa alami dengan wawasan waktu nyata, rekomendasi yang dapat ditindaklanjuti, dan ringkasan laporan data. F5 NGINX App Protect adalah WAF ringan dan berkinerja tinggi yang dirancang untuk melindungi API dan aplikasi modern di seluruh arsitektur terdistribusi dan lingkungan hibrida dengan perlindungan yang konsisten. Tidak bergantung pada platform, NGINX App Protect mengintegrasikan dengan mulus dalam proses pengembangan aplikasi Anda, mendeteksi dan mengamankan terhadap serangan aplikasi, termasuk serangan penolakan layanan (DoS) lapisan 7 dan bot. Solusi keamanan aplikasi yang kuat dan berlatensi rendah, NGINX App Protect memungkinkan Anda untuk mengamankan aplikasi di klaster Kubernetes dan cloud, membantu mengurangi biaya komputasi secara signifikan. Ini memberikan pertahanan multi-lapis, mengurangi kampanye serangan dunia maya aktif dan melampaui perlindungan kategori OWASP Top 10. F5 BIG-IP Advanced WAF adalah flagship web application firewall dari F5. Deteksi dan mitigasi dalam BIG-IP Advanced WAF yang memenangkan penghargaan berfungsi sebagai mesin untuk Distributed Cloud WAF dan NGINX App Protect. Dengan analitik perilaku, mitigasi DoS lapisan 7, enkripsi data sensitif di lapisan aplikasi, dan layanan intelijen ancaman, BIG-IP Advanced WAF melindungi aplikasi di seluruh lingkungan terdistribusi dan hibrida dari berbagai serangan aplikasi. BIG-IP Advanced WAF menyediakan dasbor dinamis yang didedikasikan yang dengan cepat dan sederhana memastikan keamanan dari ancaman yang tercantum dalam OWASP Top 10. BIG-IP Advanced WAF mencakup konfigurasi terarah untuk kasus penggunaan WAF umum, mesin pembelajaran, dan memungkinkan kustomisasi kebijakan keamanan secara rinci. Perlindungan Luas dari F5 Selain itu, F5 dapat menangani lebih banyak area yang berlaku untuk standar PCI DSS v4.0. API adalah komponen kunci dari hampir semua transaksi di berbagai industri…
AI Zero Days Telah Tiba: Apa yang Perlu Diketahui oleh CISOs
Untuk pertama kalinya, sistem penemuan kerentanannya yang didorong oleh AI telah mengidentifikasi zero-day pada perangkat lunak yang sering digunakan, menurut tim keamanan Google. Terobosan AI Google ini menegaskan pergeseran yang tak terhindarkan menuju risiko dan solusi yang didorong oleh AI. Peneliti Google menggunakan model AI, Big Sleep, untuk mengidentifikasi kerentanannya dalam keamanan memori—stack buffer underflow—pada mesin database SQLite. SQLite adalah salah satu mesin database yang paling banyak digunakan, tertanam dalam jutaan perangkat dan aplikasi. SQLite bersifat sumber terbuka dan memegang peran penting dalam rantai pasokan perangkat lunak untuk saluran data dan database. Big Sleep mengidentifikasi kerentanannya pada stack buffer underflow dalam kode, sebuah celah yang tidak terdeteksi oleh metode konvensional. Bagi CISOs, implikasinya sangat penting. AI dapat dan akan digunakan untuk mendeteksi zero-day, baik oleh aktor yang baik maupun buruk. Keamanan akan semakin dipercepat, dan AI akan diperlukan untuk mengikuti perkembangan ini. Pada saat yang sama, memastikan kontrol keamanan inti sudah diterapkan dan disetel dengan baik akan menjadi semakin penting. Momen ini menyoroti perlunya menangani ancaman yang didorong oleh AI dari dua sudut. Pertama, dengan menerapkan pertahanan yang didorong oleh AI untuk mengatasi evolusi cepat risiko keamanan. Kedua, dengan memastikan bahwa kerangka kerja keamanan yang ada diperkuat dan mampu mengintegrasikan kemampuan baru ini. Munculnya ancaman AI tidak hanya memerlukan alat yang lebih cerdas; itu memerlukan cakupan komprehensif dan otomatisasi untuk meminimalkan kesalahan manusia. Lonjakan Zero-Day yang Didorong oleh AI yang Akan Datang Model bahasa besar (LLM) yang menangani pengkodean dan analisis kode sedang berkembang pesat. Mereka juga tersedia secara bebas dan sering berada dalam domain sumber terbuka. Penyerang telah memperhatikan hal ini dan sedang aktif mencari untuk memanfaatkan AI untuk mencari kerentanannya dalam sistem. CISOs harus mengharapkan lonjakan kerentanannya yang ditemukan oleh AI yang berasal dari beberapa faktor utama: Kemampuan AI yang Canggih: Model AI modern, terutama LLM, telah menunjukkan kemampuan dalam menganalisis kode yang kompleks untuk mengidentifikasi kerentanannya yang sebelumnya tidak diketahui. Google yang memanfaatkan AI dalam Proyek Big Sleep untuk mengungkap kerentanannya zero-day yang meluas adalah contoh yang baik dari potensi AI dalam langkah proaktif untuk keamanan. Automatisasi dan Efisiensi: Alat yang didorong oleh AI dapat mengotomatiskan proses penemuan kerentanannya, secara signifikan mempercepat identifikasi kelemahan keamanan. Efisiensi ini memungkinkan deteksi kerentanannya dengan kecepatan yang tidak dapat dicapai hanya dengan metode manual. Penggunaan AI oleh GreyNoise Intelligence untuk menemukan kerentanannya di kamera streaming langsung adalah contoh dari kemampuan ini. Pemahaman Semantik yang Lebih Besar: Model AI dapat menganalisis kode dengan pemahaman yang lebih dalam tentang konteks, niat, dan fungsionalitas, menemukan kerentanannya yang mungkin terlewatkan oleh metode tradisional. Pemahaman semantik ini memungkinkan AI untuk mengidentifikasi tidak hanya kesalahan pengkodean yang jelas, tetapi juga kekurangan logika yang halus, masalah konfigurasi, dan celah keamanan yang bisa dimanfaatkan. Misalnya, OpenAI Codex telah menunjukkan kemampuan untuk menemukan kelemahan keamanan yang halus dengan menginterpretasikan perilaku yang dimaksudkan dari suatu program terhadap implementasinya yang sebenarnya. Konvergensi dari kemajuan ini berarti CISOs dan tim keamanan harus mempersiapkan diri untuk gelombang kerentanannya yang ditemukan oleh AI. Untuk tetap berada di depan, organisasi harus memprioritaskan adopsi alat pertahanan yang didorong oleh AI, meningkatkan kolaborasi antara tim pengembangan dan tim keamanan untuk mengatasi kerentanannya lebih awal, dan terus mendidik staf tentang ancaman AI yang sedang muncul. Strategi proaktif akan sangat penting untuk mengurangi risiko yang ditimbulkan oleh era baru serangan siber yang didorong oleh AI. Ini akan berarti menerapkan AI untuk melawan ancaman AI, dan juga memperkuat strategi zero trust dan strategi proaktif lainnya untuk mengurangi permukaan serangan. Pertahanan yang Lebih Dalam Menjadi Kebutuhan yang Mendalam Bagi CISOs, lanskap ancaman AI yang baru semakin menekankan pentingnya menutupi sebanyak mungkin permukaan serangan yang mungkin. Ini berarti mencakup lebih banyak data kode dan konfigurasi serta protokol. Ini juga berarti mendistribusikan mekanisme keamanan ke lebih banyak titik deteksi dalam siklus pengiriman aplikasi dan menyediakan alat serta otomatisasi untuk menghilangkan lebih banyak tugas manual. Sebagai contoh, F5 NGINX App Protect kemungkinan akan memblokir banyak zero-day yang ditemukan oleh AI dengan mencegah kelas perilaku yang anomali di berbagai protokol (HTTP/S, HTTP/2, gRPC, MQTT, dan WebSocket). NGINX App Protect dapat diterapkan di mana saja, termasuk bersama produk NGINX lainnya dan di jalur CI/CD. Untuk aspek lain dari pertahanan mendalam, konsol NGINX One SaaS berfungsi sebagai mesin rekomendasi konfigurasi otomatis, memungkinkan tim untuk dengan cepat menerapkan perubahan konfigurasi untuk memblokir zero-day di seluruh armada NGINX mereka (termasuk NGINX Plus, NGINX Open Source, produk Kubernetes, dan opsi Azure-as-a-Service). Memperluas Batasan Pertahanan Mendalam untuk Era yang Didorong oleh AI Zero-day AI bukan hanya perubahan dalam lanskap ancaman—mereka adalah gambaran masa depan keamanan siber. Penemuan kerentanannya oleh AI bukanlah kejadian yang sekali-sekali; itu adalah sinyal bahwa alat yang kita gunakan untuk melindungi diri kita harus berkembang dengan kecepatan yang sama dengan yang digunakan untuk menyerang kita. Kerentanannya yang didorong oleh AI menandai titik balik untuk keamanan siber, yang membutuhkan strategi pertahanan yang lebih luas dan lebih dalam. Saat penyerang memanfaatkan AI untuk mengungkap dan mengeksploitasi kelemahan, CISOs harus fokus pada pertahanan mendalam—menutupi lebih banyak wilayah di seluruh permukaan serangan. Ini berarti memperluas perlindungan untuk mencakup lebih banyak protokol, kode, dan data konfigurasi sambil menerapkan mekanisme keamanan di setiap tahap siklus hidup aplikasi. Meningkatnya ancaman AI tidak hanya memerlukan alat yang lebih cerdas; itu memerlukan cakupan komprehensif dan otomatisasi untuk meminimalkan kesalahan manusia. Di era baru ini, kelangsungan hidup tergantung pada memperkuat setiap lapisan dan tidak membiarkan kerentanannya tidak terlindungi.
F5 2025 Outlook Teknologi: Menavigasi Lanskap Perusahaan Baru
Saat kita memasuki tahun 2025, AI generatif mungkin mendominasi headline, tetapi itu hanya salah satu dari beberapa kekuatan yang membentuk ulang perusahaan digital. Meningkatnya biaya dan kompleksitas mendorong perusahaan untuk memindahkan kembali beban kerja penting, seperti penyimpanan dan data, dari cloud publik ke on-premises. Meskipun pergeseran ini bertujuan untuk meningkatkan kontrol dan mengoptimalkan sumber daya untuk inisiatif yang didorong oleh AI, penghentian penuh penggunaan cloud tidak akan terjadi dalam waktu dekat. Perusahaan akan terus dengan pendekatan hybrid, menyeimbangkan beban kerja di cloud publik, on-premises, dan lingkungan edge. Namun, pendekatan hybrid ini membawa tantangan baru dalam mengamankan, mengirimkan, dan mengoperasikan aplikasi di berbagai platform. Di F5, kami fokus pada teknologi baru yang menjanjikan untuk mengatasi kompleksitas ini dan mengubah pengiriman aplikasi, keamanan, dan operasi digital. Berikut adalah lima teknologi yang kami yakini akan berdampak besar pada perusahaan di tahun 2025. WebAssembly WebAssembly (Wasm) menawarkan solusi praktis untuk era multicloud hybrid, memberikan kemampuan untuk menjalankan aplikasi di mana saja runtime Wasm tersedia. Manfaat Wasm melampaui portabilitas; Wasm meningkatkan kinerja dan keamanan, memungkinkan organisasi untuk menyebarkan dan menskalakan aplikasi di berbagai lingkungan tanpa mengorbankan efisiensi. AI Agenik AI Agenik sedang merevolusi operasi perusahaan dengan menggantikan alur kerja SaaS tradisional dengan proses otomatis yang didorong oleh AI. Dengan bertindak secara otonom dalam pedoman yang telah ditentukan sebelumnya, AI Agenik memungkinkan perusahaan untuk merampingkan operasi secara lebih efektif, mengurangi ketergantungan pada perangkat lunak yang mahal dan kompleks, serta memungkinkan adaptabilitas yang lebih besar. Klasifikasi Data Dengan meningkatnya permukaan serangan dan regulasi data yang berkembang, klasifikasi data secara real-time menjadi hal yang sangat penting. Model AI generatif sedang memajukan klasifikasi data di luar sistem berbasis aturan tradisional, memungkinkan perusahaan untuk meningkatkan keamanan, memenuhi standar kepatuhan, dan mengelola informasi sensitif dengan lebih efektif. Gerbang AI Gerbang AI muncul untuk mendukung permintaan unik dari lalu lintas AI, menangani aliran data tidak terstruktur dua arah dan mengelola interaksi yang meningkat dengan bot “baik”. Gerbang ini melampaui fungsi API biasa, memungkinkan perusahaan untuk menskalakan aplikasi AI dengan lancar tanpa mengorbankan kinerja atau keamanan. Model Bahasa Kecil Kekhawatiran tentang halusinasi AI dan bias telah mempercepat adopsi Model Bahasa Kecil (SLM) dan Generasi yang Ditingkatkan dengan Pengambilan (RAG). Dengan menggabungkan sistem pengambilan dengan model generatif, SLM dan RAG memberikan hasil yang lebih akurat dan kontekstual, menjadikan aplikasi yang didorong oleh AI lebih dapat diandalkan untuk pengambilan keputusan secara real-time. Dan terakhir, kami melihat “melampaui transformer” karena teknologi ini sudah mulai melampaui batas yang harus ditembus. Seiring dengan meningkatnya permintaan untuk arsitektur AI yang efisien, keterbatasan model transformer—seperti konsumsi sumber daya yang tinggi—mendorong inovasi. Model baru, seperti model bahasa besar 1-bit, bertujuan untuk mengoptimalkan akurasi AI sambil meminimalkan kebutuhan perangkat keras. Inovasi-inovasi ini membuka jalan bagi AI yang lebih dapat diakses dan diskalakan di seluruh lingkungan perusahaan. Saat kami memandang ke depan menuju tahun 2025, F5 tetap berkomitmen untuk mengeksplorasi teknologi-teknologi ini, mengantisipasi implikasinya, dan membimbing perusahaan melalui kompleksitas lanskap digital yang terus berkembang. Untuk mengeksplorasi teknologi-teknologi ini—dan mengapa kami menganggapnya sangat penting—secara mendalam, Anda dapat mengunduh F5 2025 Tech Outlook yang berisi komentar dan pengamatan dari para ahli F5 tentang setiap teknologi ini. Saya harap Anda akan menemukannya se-informatif seperti saya saat menyusun semua ini.
Kematangan Data: Hambatan untuk AI Lanjutan
Setiap survei tentang AI generatif—termasuk survei kami sendiri—mengarah pada satu kesimpulan yang tidak bisa dihindari: kematangan data akan menjadi penghalang untuk sepenuhnya mewujudkan potensi AI generatif. Ketika kami bertanya tentang tantangan dalam adopsi AI, respons teratas dari 56% responden adalah “kematangan data.” Melihat sekeliling industri menunjukkan bahwa kematangan data adalah hambatan serius dalam perjalanan adopsi AI. Apa itu kematangan data? Kematangan data, dalam konteks AI, mengacu pada praktik pengelolaan data organisasi yang kurang berkembang atau tidak memadai, yang membatasi kemampuannya untuk memanfaatkan AI secara efektif. Hal ini mencakup masalah kualitas data, aksesibilitas, tata kelola, dan infrastruktur, seperti: Kualitas data yang buruk: Data yang tidak konsisten, tidak lengkap, atau usang mengarah pada hasil AI yang tidak dapat diandalkan. Keterbatasan ketersediaan data: Silo data di berbagai departemen menghambat akses dan analisis yang komprehensif, membatasi wawasan yang diperoleh. Tata kelola data yang lemah: Kurangnya kebijakan tentang kepemilikan data, kepatuhan, dan keamanan memperkenalkan risiko dan membatasi penggunaan AI. Infrastruktur data yang tidak memadai: Alat dan infrastruktur yang tidak mencukupi menghambat pemrosesan data dan pelatihan model AI secara skala besar. Strategi data yang tidak jelas: Kurangnya strategi yang jelas menghasilkan inisiatif yang tidak terkoordinasi dan fokus terbatas pada data yang bernilai untuk AI. Kematangan data mencegah organisasi untuk memanfaatkan potensi penuh AI karena data yang berkualitas tinggi, dikelola dengan baik, dan dapat diakses adalah dasar untuk mengembangkan sistem AI yang dapat diandalkan dan efektif. Organisasi yang ingin mengatasi kematangan data sering kali mulai dengan membangun strategi data, mengimplementasikan kebijakan tata kelola data, berinvestasi dalam infrastruktur data, dan meningkatkan literasi data di seluruh tim. Dampak pada Adopsi AI Kami membahas semua hal tersebut untuk sampai pada inti dari tulisan ini: kematangan data adalah hambatan dalam adopsi AI. Adopsi AI sudah melambat karena organisasi sebagian besar telah memanfaatkan AI generatif yang mudah diakses (chatbot, asisten, co-pilot) dan menghadapi masalah kematangan data saat mereka berusaha beralih ke kasus penggunaan yang lebih bernilai seperti otomatisasi alur kerja. Organisasi yang gagal memprioritaskan kematangan data akan kesulitan untuk membuka kemampuan AI yang lebih maju. Kematangan data mengarah pada kurangnya kepercayaan terhadap analisis dan prediktabilitas eksekusi. Ini membatasi rencana untuk memanfaatkan AI dalam cara yang lebih otonom—baik untuk otomatisasi proses bisnis atau operasional. Sebuah studi tahun 2023 oleh MIT Sloan Management Review menyoroti bahwa organisasi dengan praktik manajemen data yang matang 60% lebih mungkin berhasil dalam otomatisasi alur kerja dibandingkan mereka yang memiliki praktik data yang belum matang. Kematangan data membatasi akurasi prediktif dan keandalan AI, yang sangat penting untuk fungsi otonom di mana keputusan dibuat tanpa campur tangan manusia. Organisasi harus—dan ini adalah HARUS—menyusun pengelolaan data mereka terlebih dahulu sebelum mereka dapat benar-benar memanfaatkan potensi AI untuk mengoptimalkan alur kerja dan membebaskan waktu berharga bagi manusia untuk fokus pada strategi dan desain, tugas-tugas yang belum cocok untuk sebagian besar AI saat ini. Mengatasi Kematangan Data Mengatasi kematangan data sangat penting untuk memungkinkan kemampuan AI lanjutan. Langkah-langkah kunci termasuk: Mengembangkan strategi data yang jelas Menyelaraskan pengumpulan data, pengelolaan, dan standar kualitas dengan tujuan organisasi untuk memastikan data mendukung proyek AI secara efektif. Menerapkan tata kelola data yang kuat Menetapkan kebijakan untuk kepemilikan data, kepatuhan, keamanan, dan privasi untuk meningkatkan kualitas data dan membangun kepercayaan terhadap wawasan AI. Berinvestasi dalam infrastruktur data yang dapat diskalakan Mengadopsi infrastruktur modern, seperti penyimpanan cloud dan saluran data, untuk mendukung pemrosesan yang efisien dan pelatihan AI yang dapat diskalakan. Meningkatkan standar kualitas data Menetapkan standar untuk akurasi, konsistensi, dan kelengkapan data, dengan pemantauan dan pembersihan data secara rutin. Mempromosikan literasi data dan kolaborasi Mendorong budaya literasi data dan kerja sama antara unit data dan bisnis untuk meningkatkan aksesibilitas dan dampak data. Dengan mengadopsi praktik-praktik ini, organisasi dapat membangun fondasi data yang kokoh untuk AI, yang mengarah pada alur kerja yang dioptimalkan, pengurangan risiko, dan lebih banyak waktu untuk tugas-tugas strategis. Kematangan data bukan hanya kebutuhan teknis; itu adalah keuntungan strategis yang memberdayakan organisasi untuk membuka potensi penuh AI. Dengan mengatasi kematangan data, organisasi dapat beralih dari aplikasi AI dasar ke kasus penggunaan yang lebih transformasional dan bernilai, akhirnya memposisikan diri untuk sukses jangka panjang dalam masa depan yang didorong oleh AI.
Pentingnya Segmentasi Jaringan untuk Pabrik AI
Selama bertahun-tahun, segmentasi jaringan telah menjadi kunci yang memfasilitasi isolasi ancaman, diferensiasi kualitas layanan, respons dan analisis insiden, audit kepatuhan, dan banyak fungsi interoperabilitas penting lainnya. Namun, ketika kita mengagungkan prinsip zero trust dan terburu-buru dalam menerapkan AI, apakah kita telah mengabaikan elemen inti dari infrastruktur jaringan yang menjadi dasar bagi keamanan siber dan operasi layanan modern? Dalam seri pabrik AI kami sebelumnya, kami mendefinisikan pabrik AI sebagai investasi besar dalam penyimpanan, jaringan, dan komputasi yang melayani kebutuhan pelatihan dan inferensi berperforma tinggi dan bervolume besar. Untuk mewujudkan pengembalian dari investasi ini, pabrik AI secara dinamis menjadwalkan penggunaan unit pemrosesan grafis (GPU) dan komputasi yang bernilai tinggi untuk melakukan pelatihan dan inferensi ini. Penjadwalan GPU memerlukan arsitektur beberapa “penyewa” layanan AI per klaster AI. Ini menimbulkan masalah yang sering tidak disadari oleh banyak tim operasi hingga sering kali sudah terlambat. Menyelaraskan Sumber Daya Klaster Pabrik AI dengan Segmentasi Jaringan Di dalam sebuah klaster AI, kita dapat secara logis mensegmentasi sumber daya dengan konteks penyewa, yang memungkinkan untuk kuota penyewa, batas konsumsi sumber daya, keamanan sistem host, dan kontrol akses berbasis peran (RBAC) manajemen. Namun, konteks penyewa ini tidak diekspos oleh layanan jaringan dasar yang menyediakan lalu lintas masuk dan keluar klaster AI ke seluruh jaringan pabrik AI. Tanpa konteks ini, dasar dari keamanan siber di pusat data, segmentasi jaringan menjadi buta. Metode umum untuk mengekspos konteks penyewa yang diperlukan sering kali secara signifikan merampas komputasi bernilai tinggi dari pabrik AI atau memperlambat jalur jaringan di bawah batas yang diperlukan untuk latensi layanan, bandwidth, atau konkurensi. Kita menghadapi pilihan palsu antara memanfaatkan sumber daya pabrik AI yang bernilai tinggi secara efisien dan integrasi penyewa yang tepat dengan jaringan. Segmentasi Jaringan di Infrastruktur Cloud Publik Di infrastruktur cloud publik, desain jaringan multi-penyewa yang terorkestrasi adalah dasar dari semua layanan dalam satu wilayah cloud dan diimplementasikan dengan virtual private clouds (VPC). Segmentasi jaringan virtual ini sangat penting untuk keamanan dan pengukuran sumber daya. Penyedia cloud publik mempertahankan fungsi ini dengan tim pengembang perangkat lunak jaringan dan perangkat keras jaringan khusus, termasuk SmartNIC dan unit pemrosesan data (DPU). Klaster pabrik AI di cloud publik dirancang untuk memanfaatkan orkestrasi jaringan VPC infrastruktur yang mendasarinya. Biaya untuk mempertahankan VPC cukup substansial, tetapi ini adalah inti dari model bisnis cloud publik. Pertanyaannya adalah: Bagaimana sebuah organisasi dapat memaksimalkan investasi pabrik AI-nya dan menjadwalkan GPU serta komputasi secara dinamis tanpa tingkat investasi yang sama seperti penyedia cloud publik? Langkah Pertama Industri Langkah pertama industri dalam perjalanan ini adalah menggunakan virtualisasi server untuk membuat mesin virtual (VM). VM memanfaatkan pass-through perangkat keras untuk terhubung ke jaringan pusat data yang tersegmentasi. Cukup tempatkan semua mesin virtual pada VLAN yang sama, dan kita dapat melanjutkan operasi seperti biasa jika kita hanya khawatir tentang satu penyewa dalam satu klaster AI. VM juga dapat menangani segmentasi GPU karena vendor GPU mendukung cara untuk membagi perangkat GPU menjadi set inti dan memori, kemudian menetapkannya ke mesin virtual tertentu. Namun, segmentasi perangkat GPU tidak dinamis dan memerlukan restart VM. Selain itu, desain ini membatasi kemampuan untuk membuat kumpulan sumber daya GPU yang dapat diukur di seluruh banyak penyewa. Ini adalah kekurangan signifikan dari solusi ini. Menyelaraskan Segmentasi Jaringan dengan Klaster Pabrik AI Multi-Penyewa Apa yang terjadi pada klaster pabrik AI kita ketika mereka tidak lagi dapat melayani satu penyewa? Masalah ini bergeser ke pusat data. Dalam klaster pabrik AI, secara default, semua lalu lintas jaringan yang keluar dari pusat data akan diterjemahkan alamat jaringan sumber (SNAT) ke alamat IP node klaster individu yang menjalankan beban kerja tercontainer yang mengeluarkan permintaan jaringan tersebut, secara efektif menyembunyikan sumber sebenarnya. Lalu lintas ini kemudian berasal dari segmen jaringan tempat node itu dideploy. Untuk klaster multi-penyewa, ini berarti kita kehilangan konteks penyewa, dan kita mendapatkan arus lalu lintas keluar yang tercampur dari berbagai penyewa yang mustahil untuk dipilah, diamankan, diperbaiki, atau diaudit. Masalah ini semakin parah ketika lalu lintas masuk juga dipertimbangkan. Sementara lalu lintas masuk mungkin lebih mudah dikelola karena sudah diarahkan dari pusat data yang tersegmentasi, bagaimana cara mengkorelasikan lalu lintas masuk penyewa tunggal dengan lalu lintas keluarnya? Jawabannya berfokus pada retrieval-augmented generation (RAG) dan layanan agen, yang berkomunikasi secara intensif untuk memperoleh data eksternal dan menggunakan layanan eksternal. Ini menjadi usaha lintas tim dengan insinyur platform dan NetOps yang mengidentifikasi masalah untuk pelanggan atau berusaha melewati audit keamanan. Segmentasi Jaringan Terorkestrasi yang Sadar Klaster untuk Pabrik AI Pabrik AI harus merencanakan solusi jaringan yang kaya fitur, dapat diprogram, aman, dan rendah latensi yang skalabel dalam hal bandwidth dan konkurensi. Konteks penyewa pada Layer 2 (misalnya, VLAN, VxLAN) dan Layer 3 (misalnya, Subnet, antarmuka IPSEC) harus disajikan dari dalam klaster ke jaringan pabrik AI. Metrik observabilitas, log, dan alat pemecahan masalah harus tersedia untuk NetOps. Secara tradisional, banyak solusi tenancy aplikasi dan visibilitas ini disediakan oleh F5 BIG-IP. F5 BIG-IP Container Ingress Services (CIS) secara dinamis menemukan layanan Kubernetes dan mengeksposnya ke pusat data sebagai server virtual, objek konfigurasi yang akan dikenali oleh administrator BIG-IP dari pengaturannya untuk menyajikan server fisik dan mesin virtual. Meskipun BIG-IP menyediakan banyak kebutuhan yang kita cari dalam sebuah solusi, BIG-IP tidak mengelola lalu lintas keluar dari klaster AI ke jaringan pabrik AI, yang diperlukan untuk mempertahankan segmentasi. Untuk mengatasi masalah ini, kami merancang F5 BIG-IP Next untuk Kubernetes, solusi untuk klaster komputasi multi-penyewa yang dibangun di atas platform generasi berikutnya kami, BIG-IP Next. F5 BIG-IP Next untuk Kubernetes sepenuhnya dikelola melalui kontrol plane Kubernetes dan mendukung otentikasi manajemen Kubernetes, RBAC untuk semua sumber daya yang dideklarasikan, mengenali tenancy Kubernetes melalui namespace untuk mendukung segmentasi jaringan yang diperlukan untuk lalu lintas masuk dan keluar. Ini sangat penting untuk arsitektur yang mengutamakan orkestrasi seperti pabrik AI. F5 BIG-IP Next untuk Kubernetes memberikan cara yang disederhanakan bagi NetOps untuk mendeklarasikan pemetaan antara namespace Kubernetes dan segmen jaringan. Peering rute dinamis antara jaringan pabrik AI dan instansi BIG-IP Next menggunakan sintaks konfigurasi rute yang sudah dikenal. Tim NetOps memiliki kemampuan unik untuk memecahkan masalah lalu lintas jaringan langsung untuk lalu lintas masuk dan keluar klaster dengan aman. Tim SecOps…
F5 Giving Tuesday 2024: Memberdayakan Tujuan Melalui Kedermawanan yang Penuh Semangat
Tindakan sederhana memberi dapat menciptakan gelombang perubahan yang meluas jauh melampaui satu sumbangan. Ini tentang koneksi, kasih sayang, dan keyakinan kuat bahwa bersama-sama, kita dapat membuat perbedaan. Di F5, kami sepenuhnya mengadopsi filosofi ini, dan kampanye Giving Tuesday tahunan kami adalah bukti dari hal tersebut. Selama enam tahun terakhir, kami telah mengubah Giving Tuesday dari satu hari kedermawanan menjadi perayaan 10 hari yang memberikan dampak secara global, didorong oleh semangat dan komitmen dari para F5er. Giving Tuesday adalah pengalaman yang sangat pribadi bagi semua yang berpartisipasi, dan yang menyatukan tenaga kerja global kami dalam tujuan bersama. Untuk F5 Giving Tuesday 2024, setiap karyawan F5 menerima $50 USD untuk disumbangkan ke lebih dari 2 juta organisasi nirlaba melalui platform pemberian dan sukarelawan tempat kerja kami, Benevity. Namun, ini lebih dari sekadar uang; ini tentang memberdayakan orang-orang kami untuk mendukung tujuan yang paling dekat di hati mereka. Kami bekerja sama dengan kelompok inklusi karyawan (EIG), pemimpin tim, dan administrator kantor lokal untuk memberikan panduan dan inspirasi, memastikan setiap orang merasa terhubung, terinspirasi, dan diberdayakan untuk berpartisipasi. Sebagai salah satu dari banyak program F5 Global Good, Giving Tuesday telah mengalami evolusi yang luar biasa. Kami mulai dengan tingkat partisipasi karyawan sebesar 38% pada 2019 dan telah melesat hingga 81% tahun ini, dengan 100% lokasi global kami berpartisipasi—kampanye kami yang paling sukses hingga saat ini. Hingga saat ini, F5er telah secara kolektif menyumbangkan hampir $3 juta melalui kampanye 10 hari ini, angka yang diperkuat dengan pencocokan sumbangan 100% dari F5. Tentu saja, kampanye ini jauh melampaui statistik. Kampanye ini telah memberikan dampak mendalam bagi F5er kami dan banyak tujuan berharga. Karyawan telah berbagi cerita yang sangat pribadi—menyumbang untuk penelitian kanker sebagai penghormatan kepada orang yang mereka cintai, mendukung organisasi anak angkat berdasarkan pengalaman mereka sendiri—membangun ikatan yang lebih kuat dan menciptakan tempat kerja yang lebih penuh kasih sayang. Cerita-cerita ini menjadi pengingat yang kuat akan koneksi manusia yang ada di jantung pemberian kami. Di sini, karyawan F5 berbagi kata-kata inspiratif mereka tentang apa arti Giving Tuesday bagi mereka, organisasi yang mereka pilih untuk didukung, dan bagaimana hal itu membantu orang lain.