• Home
  • Renesas telah mengembangkan CHIP KECERDASAN buatan (AI) yang mencapai efisiensi daya hingga 10 kali lipat dari teknologi konvensional.

Renesas telah mengembangkan CHIP KECERDASAN buatan (AI) yang mencapai efisiensi daya hingga 10 kali lipat dari teknologi konvensional.

Chip AI ini dikembangkan dengan menggabungkan akselerator AI milik Renesas “DRP-AI”. Dengan teknologi pengurangan bobot AI yang semakin meningkatkan efisiensi daya. Hasilnya, dapat dipasang di berbagai perangkat seperti kamera keamanan, kendaraan terpandu otomatis. Dan robot servis sebagai perangkat AI yang mengonsumsi lebih sedikit daya dan merespons secara real time. Selain itu, kami mengembangkan sistem pembelajaran titik akhir yang secara mandiri merespons perubahan di lingkungan dan tugas di tempat. Dan mendemonstrasikan operasi dasarnya. anti nawala

Chip Kecerdasan

NEDO (Organisasi Pengembangan Teknologi Industri dan Energi Baru) mempromosikan pengembangan chip kecerdasan buatan (AI). Teknologi komputasi generasi mendatang yang memungkinkan pemrosesan dengan efisiensi tinggi dan kecepatan tinggi. mengembangkan chip kecerdasan buatan (AI) menggunakan (DRP). Efisiensi daya adalah 10 TOPS (10 triliun operasi/detik) per watt (watt), yang mencapai 10 kali lebih tinggi daripada teknologi konvensional.

Ikhtisar

Ketika populasi pekerja menurun karena penurunan angka kelahiran dan populasi yang menua. Hal itu dapat disematkan pada robot layanan dan kamera keamanan yang. Beroperasi di berbagai lingkungan sosial seperti pabrik, logistik, dan perawatan medis.Perlu perangkat AI yang responsif. Selain itu, untuk mempromosikan penggunaan AI, perlu juga dikembangkan teknologi chip kecerdasan buatan (AI). Yang secara fleksibel beradaptasi dengan lingkungan tempat peralatan ditempatkan.

Di sisi lain, karena pemrosesan AI membutuhkan banyak kalkulasi. Panas yang dihasilkan akibat peningkatan konsumsi daya merupakan hambatan untuk penggunaan praktis chip kecerdasan buatan (AI) AI yang ada. Misalnya, hingga saat ini, untuk memasang chip AI di perangkat seperti kamera atau robot, perlu memasang kipas untuk menekan panas. Untuk mengatasi masalah ini, diperlukan kinerja melakukan pemrosesan AI tingkat lanjut dalam beberapa watt, seperti PC kelas 100W (watt).

Dengan latar belakang ini, Renesas Electronics ( Renesas *2 yang menangani tugas kompleks bekerja sama dengan. Tokyo Institute of Technology, SOINN, dan Mitsubishi Electric, dan mengoperasikan pemrosesan AI canggih dengan konsumsi daya rendah. Bertujuan untuk aplikasi praktis dari chip kecerdasan buatan (AI) AI yang disematkan, kami sedang mengembangkan arsitektur dan alat pendukung desain.

Kali ini, Renesas telah mengembangkan chip AI yang menggabungkan DRP-AI, akselerator AI unik *3 yang menggabungkan kinerja pemrosesan AI. Tinggi dan konsumsi daya rendah menggunakan DRP, dan teknologi pengurangan bobot AI yang semakin meningkatkan efisiensi daya. Mencapai efisiensi daya dari 10 TOPS (triliun kali/detik) *4 per 1W, yang berarti 10 kali lebih tinggi dari teknologi konvensional . Selain itu, dengan menggunakan DRP, kami mengembangkan sistem pembelajaran endpoint *5 yang dapat secara mandiri. Merespons perubahan lingkungan dan tugas di lapangan, serta mendemonstrasikan operasi dasarnya.

Hasil verifikasi pembangunan dan pengoperasian chip kecerdasan buatan (AI)

Pengembangan akselerator AI generasi berikutnya berdasarkan akselerator AI milik Renesas “DRP-AI”

Chip AI yang dikembangkan kali ini didasarkan pada DRP milik Renesas. Aplikasi dapat dijalankan saat secara dinamis mengalihkan konfigurasi koneksi sirkuit dari unit aritmatika dalam chip. Sesuai dengan konten pemrosesan untuk setiap jam operasi*6, dan hanya sirkuit aritmatika yang diperlukan yang beroperasi. Menghasilkan konsumsi daya yang rendah dan .kecepatan “DRP-AI” adalah akselerator AI yang mengintegrasikan DRP ini dengan unit operasi penjumlahan produk (AI-MAC) *7 . Kali ini, berdasarkan “DRP-AI” ini, akselerator AI generasi baru yang dapat memproses model AI ringan secara efisien telah dikembangkan.

Pengembangan teknologi ringan chip kecerdasan buatan (AI) yang mengurangi jumlah komputasi hingga 90%

Pemrosesan AI telah dipercepat dengan pemangkasan *8 , yang menghilangkan kalkulasi yang memiliki sedikit efek pada akurasi pengenalan, di antara teknik pengurangan bobot model AI biasa . Biasanya model AI memiliki operasi tidak teratur yang tidak memengaruhi akurasi pengenalan. Oleh karena itu, ada perbedaan antara paralelisme pemrosesan perangkat keras dan pemangkasan yang tidak teratur.

Akselerator AI yang dikembangkan kali ini memanfaatkan fleksibilitas tinggi DRP-AI, seperti teknologi pengalihan sirkuit dinamisnya, untuk melewati operasi secara efisien bahkan ketika dipangkas halus di cabang demi cabang. Akibatnya, dimungkinkan untuk melakukan pemrosesan sambil mempertahankan paralelisme perangkat keras yang tinggi sambil mempersempit ke hanya operasi yang diperlukan untuk akurasi pengenalan. Model AI dengan tingkat pemangkasan *9 yang mengurangi jumlah komputasi hingga 90% mencapai kecepatan hingga 10 kali lebih cepat daripada teknologi konvensional dan mencapai efisiensi daya hingga 10 TOPS per 1W. Selain itu, meskipun tergantung pada modelnya, bahkan jika jumlah perhitungan dikurangi hingga 90% dengan pemangkasan, akurasi pengenalan hanya akan turun sekitar 3%, dan telah dipastikan bahwa akurasi yang hampir sama dapat diperoleh.

Selain itu, alat implementasi AI dikembangkan yang mengotomatiskan end-to-end dari optimasi model pemangkasan hingga implementasi perangkat keras sehingga pengguna dapat dengan mudah mengimplementasikan berbagai model AI. Hasilnya, kami berhasil mengembangkan akselerator AI yang mencapai “kinerja tinggi dan konsumsi daya rendah” dan “fleksibilitas untuk merespons evolusi AI” dan mampu mengeksekusi AI dengan sangat akurat.

Konstruksi sistem pembelajaran titik akhir yang dapat merespons lingkungan secara mandiri

Salah satu tantangan dalam menggunakan sistem yang dilengkapi AI di lingkungan nyata adalah masalah akurasi pengenalan yang bervariasi tergantung pada lokasi pemasangan perangkat dan variasi sensor. Pembelajaran tambahan, di mana bagian dari jaringan saraf dilatih ulang di lingkungan tempat perangkat dipasang, efektif dalam menyelesaikan masalah ini. Sampai saat ini, terdapat sistem untuk pembelajaran tambahan di cloud, namun masih ada masalah seperti pengamanan lingkungan komunikasi dengan cloud, masalah privasi, dan kenaikan biaya server pembelajaran. Kali ini, dengan menggunakan fleksibilitas tinggi DRP untuk mengimplementasikan algoritme pembelajaran, teknologi pembelajaran titik akhir dikembangkan yang secara bersamaan mengeksekusi eksekusi AI dan pembelajaran tambahan dalam “DRP-AI”.

Akibatnya, menjadi mungkin untuk membangun sistem pembelajaran tepi yang secara mandiri beradaptasi dengan perubahan dalam lingkungan dan tugas operasi di tempat. Selain itu, karena dimungkinkan untuk belajar di latar belakang tanpa menghentikan eksekusi AI, tidak perlu mengamankan waktu untuk pembelajaran tambahan atau mengumpulkan data, membuat pengoperasian menjadi lebih mudah. Hasilnya, dimungkinkan untuk mengeksekusi AI tertanam yang sangat akurat yang merespons secara waktu nyata, terlepas dari lokasi pemasangan perangkat atau variasi sensor.

Demonstrasi

Kami membuat prototipe chip AI yang dilengkapi dengan teknologi ini dan mengevaluasi kinerja lapisan konvolusional*10, yang beratnya 1/10. Efisiensi efektif (10 TOPS per 1 W) diverifikasi melalui demonstrasi. Efisiensi daya lebih dari 10 kali lebih tinggi daripada produk Renesas saat ini.

Rencana masa depan chip kecerdasan buatan (AI)

NEDO dan organisasi lain akan berkolaborasi untuk melakukan evaluasi terperinci dan eksperimen demonstrasi terkait teknologi ini. Selain itu, Renesas berencana untuk menerapkan teknologi AI dari penelitian ini ke produk untuk bisnis infrastruktur IoT agar dapat digunakan secara praktis sesegera mungkin. Pembentukan teknologi ini akan memperluas otomatisasi di berbagai industri seperti pasar pintar dan robotika, serta berkontribusi pada penciptaan layanan baru dengan mempercepat transformasi digital (DX).

Anotasi

*1 Pengembangan teknologi chip kecerdasan buatan AI dan komputasi generasi mendatang yang memungkinkan pemrosesan dengan efisiensi tinggi dan kecepatan tinggi
Periode: 2018-2022

*2 Prosesor yang Dapat Dikonfigurasi Secara Dinamis (DRP)
DRP adalah perangkat keras Renesas unik yang menjalankan aplikasi sambil secara dinamis mengalihkan koneksi antar unit komputasi. Lebih dari 10 kali lebih cepat daripada prosesor tertanam. DRP adalah inti IP yang menggabungkan daya pemrosesan tinggi dari logika perangkat keras dengan fleksibilitas tinggi dan kemampuan ekspansi CPU.

*3 Akselerator AI
Mesin (unit fungsional) yang menjalankan algoritme yang dikembangkan untuk pembelajaran mesin, seperti aplikasi AI, khususnya jaringan saraf. DRP-AI adalah kombinasi dari DRP dan unit aritmatika khusus untuk operasi penjumlahan produk.

TOPS (triliun operasi per detik)

Satuan yang menyatakan efisiensi daya per detik sebagai TOPS (tera operasi per detik). Semakin tinggi nilai numeriknya, semakin rendah konsumsi daya saat memproses masalah tertentu pada kecepatan tertentu, sehingga dapat dikatakan efisiensinya tinggi.

Perangkat terminal yang terhubung ke jaringan titik akhir , yang digunakan di berbagai perangkat seperti terminal seluler, kamera jaringan, peralatan rumah tangga, dan robot. Sinyal yang digunakan oleh sirkuit yang beroperasi dengan panjang gelombang tertentu, seperti CPU, untuk mengimbangi pemrosesan. Puncak dan lembah panjang gelombang membentuk satu jam, dan pemrosesan yang dilakukan oleh CPU dan memori membutuhkan satu jam sebagai satu siklus. Multiply-and-accumulate operation unit (AI-MAC) Unit aritmatika khusus untuk operasi perkalian-dan-akumulasi, yang sering digunakan dalam operasi jaringan neural. Pemrosesan paralel oleh sejumlah besar unit aritmatika penjumlahan produk memungkinkan pemrosesan jaringan saraf berkecepatan tinggi.

Algoritme yang menghilangkan beberapa neuron (dimensi vektor peta fitur) dan koneksi sinaptik (elemen koefisien bobot) untuk mengurangi kompleksitas komputasi dan kapasitas memori yang diperlukan sambil mempertahankan akurasi pengenalan jaringan saraf yang dipangkas. Di antara unsur-unsur koefisien, suatu metode digunakan di mana unsur-unsur dengan nilai absolut terkecil diganti dengan 0 dengan laju konstan dan dipelajari kembali. Nilai yang menunjukkan berapa persen operasi yang dapat dihilangkan dalam model AI. Semakin besar nilai ini, semakin banyak kompleksitas komputasi dan memori jaringan saraf dapat dikurangi. Operasi yang mengekstraksi titik fitur dari gambar lapisan konvolusi. Karena AI pengenalan gambar menempati sebagian besar pemrosesan, kekuatan pemrosesan yang tinggi dari lapisan konvolusi sangat memengaruhi kinerja AI secara keseluruhan.