[go: up one dir, main page]


Diposting oleh Joe Fernandez – Google AI Developer Relations

Kita akan memasuki tahun menarik lainnya dalam dunia Kecerdasan Buatan (AI) dan inilah waktunya untuk membangun lebih banyak aplikasi dengan teknologi Google AI! Serial video Membangun dengan Google AI diperuntukkan bagi developer yang ingin membuat aplikasi bermanfaat dan praktis dengan AI. Kami berfokus pada proyek pemrograman yang berguna yang dapat Anda terapkan dan kembangkan di waktu senggang Anda untuk menghadirkan kekuatan kecerdasan buatan ke dalam alur kerja atau organisasi Anda. Pada season pertama, kami menerima lebih dari 100.000 penayangan dalam enam minggu! Kami senang saat tahu banyak dari Anda menyukai serial ini, dan kami menjadi bersemangat untuk menghadirkan lebih banyak lagi proyek aplikasi Google AI kepada Anda.

Hari ini, kami meluncurkan Season ke-2 dari serial Membangun dengan Google AI, yang menampilkan proyek yang dibuat dengan teknologi Gemini API Google. Peluncuran Gemini dan Gemini API telah memberikan para developer kemampuan AI yang lebih maju, termasuk penalaran tingkat lanjut, pembuatan konten, sintesis informasi, dan interpretasi gambar. Tujuan kami pada season ini adalah membantu Anda menggunakan kemampuan tersebut untuk Anda dan organisasi Anda.


Pola aplikasi AI

Serial Membangun dengan Google AI menampilkan proyek pemrograman aplikasi praktis yang dibuat untuk Anda gunakan dan sesuaikan. Namun, kami tahu bahwa Anda adalah penilai terbaik atas apa yang Anda atau organisasi Anda perlukan untuk memecahkan masalah sehari-hari dan menyelesaikan pekerjaan. Itu sebabnya setiap aplikasi yang kami tampilkan dalam serial ini juga dimaksudkan untuk digunakan sebagai pola AI. Anda dapat segera meningkatkan aplikasi untuk memecahkan masalah dan memberikan nilai bagi bisnis Anda, dan aplikasi ini menunjukkan pola pengkodean umum untuk mendapatkan manfaat dari teknologi AI.

Pada season kedua serial ini, kami menunjukkan cara Anda dapat memanfaatkan kemampuan model Gemini AI Google untuk aplikasi. Berikut informasi yang terbaru:

  • AI Slides Reviewer dengan Google Workspace (20/3) - Interpretasi gambar adalah salah satu fitur baru terbesar model Gemini. Kami menunjukkan cara menggunakannya secara praktis dengan aplikasi ulasan presentasi untuk Google Slide yang dapat Anda sesuaikan dengan pedoman dan rekomendasi organisasi Anda. 
  • AI Flutter Code Agent dengan Gemini API (27/3) - Pemrograman kode adalah episode paling populer dari season lalu, jadi kami menggali topik ini lebih dalam. Buat ekstensi pemrograman kode untuk menulis kode Flutter dan menjelajahi desain serta tampilan antarmuka pengguna hanya dengan beberapa kata deskripsi.
  • AI Data Agent dengan Google Cloud (3/4) - Mengapa menulis pemrograman untuk mengekstrak data ketika Anda bisa memintanya? Bangun aplikasi web yang menggunakan fitur Panggilan Fungsi Gemini API untuk menerjemahkan pertanyaan menjadi panggilan kode dan data menjadi jawaban bahasa sederhana.

Season 1 di-upgrade ke Gemini API: Kami telah meng-upgrade versi Tutorial Season 1 dan proyek kode untuk menggunakan Gemini API sehingga Anda dapat memanfaatkan teknologi AI generatif terbaru dari Google. Jangan lupa memeriksanya!


Belajar dari para developer

Sama seperti season lalu, kami akan kembali ke studio untuk berbicara dengan para pemrogram kode yang membuat proyek ini sehingga mereka dapat berbagi apa yang telah mereka pelajari selama ini. Bagaimana Anda membuat model Gemini dapat mengulas keseluruhan presentasi? Apa cara paling efektif untuk menghasilkan kode dengan AI? Bagaimana cara Anda mendapatkan database untuk menjawab pertanyaan dengan Gemini API? Dapatkan insight tentang pengkodean dengan AI untuk memulai proyek pengembangan Anda sendiri.


Rumah baru bagi konten developer AI

Developer yang tertarik dengan penawaran AI Google kini memiliki rumah baru di ai.google.dev. Di sana, Anda akan menemukan banyak sumber daya untuk membangun dengan AI dari Google, termasuk tutorial Membangun dengan Google AI. Nantikan lebih banyak konten sepanjang sisa tahun ini.

Kami sangat antusias dalam mempersembahkan season kedua Membangun dengan Google AIlihat Season 2 sekarang juga! Gunakan komentar video tersebut untuk memberi tahu kami pendapat Anda serta memberi tahu kami apa yang ingin Anda lihat di episode mendatang.

Terus belajar! Terus membangun!



Diposting oleh Cher Hu, Product Manager, dan Saravanan Ganesh, Software Engineer, untuk Gemini API

Postingan berikut ini awalnya dipublikasikan pada bulan Oktober 2023. Saat ini, kami telah memperbarui postingan tersebut untuk berbagi cara menyesuaikan model Gemini dengan mudah di Google AI Studio atau dengan Gemini API.


Tahun lalu, kami meluncurkan Gemini 1.0 Pro, model multimodal berukuran sedang yang dioptimalkan untuk penskalaan di berbagai tugas. Kemudian dengan 1.5 Pro tahun ini, kami menunjukkan kemungkinan akan apa yang dapat dilakukan oleh model bahasa besar dengan jendela konteks 1M eksperimental. Sekarang, untuk menyesuaikan model (teks) Gemini 1.0 Pro yang tersedia secara umum dengan cepat dan mudah untuk kebutuhan spesifik Anda, kami telah menambahkan Gemini Tuning ke Google AI Studio dan Gemini API.


Apa yang dimaksud dengan penyesuaian?

Developer sering kali membutuhkan kualitas output yang lebih tinggi untuk kasus penggunaan khusus daripada yang bisa dicapai melalui few-shot prompting. Penyesuaian meningkatkan teknik ini dengan melatih model dasar secara lebih lanjut pada lebih banyak contoh khusus tugas—begitu banyak sehingga semuanya tidak dapat dimasukkan ke dalam prompt.


Fine-tuning vs. Parameter Efficient Tuning

Anda mungkin pernah mendengar tentang "fine-tuning" model klasik. Di sinilah model yang telah dilatih sebelumnya disesuaikan untuk tugas tertentu dengan melatihnya pada set data berlabel khusus tugas yang lebih kecil. Namun, dengan LLM saat ini dan sejumlah besar parameternya, fine-tuning menjadi kompleks: membutuhkan keahlian machine learning, banyak data, dan banyak komputasi.

Penyesuaian di Google AI Studio menggunakan teknik yang disebut Parameter Efficient Tuning (PET) untuk menghasilkan model khusus yang berkualitas lebih tinggi, dengan latensi yang lebih rendah daripada few-shot prompting tanpa biaya tambahan dan kompleksitas fine-tuning tradisional. Selain itu, PET menghasilkan model berkualitas tinggi hanya dengan beberapa ratus titik data, sehingga mengurangi beban pengumpulan data bagi developer.


Mengapa melakukan penyesuaian?

Penyesuaian memungkinkan Anda menyesuaikan model Gemini dengan data Anda sendiri agar dapat beperforma lebih baik untuk tugas khusus sekaligus mengurangi ukuran konteks prompt dan latensi respons. Developer dapat menggunakan penyesuaian untuk berbagai kasus penggunaan, termasuk tetapi tidak terbatas pada:

  • Klasifikasi: Menjalankan tugas bahasa natural seperti mengklasifikasikan data Anda ke dalam kategori yang telah ditentukan sebelumnya, tanpa membutuhkan banyak alat ataupun pekerjaan manual.
  • Ekstraksi informasi: Mengekstrak informasi terstruktur dari sumber data yang tidak terstruktur untuk mendukung tugas hilir dalam produk Anda.
  • Pembuatan output terstruktur: Membuat data terstruktur, seperti tabel, dengan cepat dan mudah.
  • Model Kritik: Menggunakan penyesuaian untuk membuat model kritik agar dapat mengevaluasi output dari model lain.

Mulai cepat dengan Google AI Studio


1. Buat model yang disesuaikan

Menyesuaikan model di Google AI Studio sangatlah mudah. Cara ini tidak memerlukan keahlian engineering untuk membangun model khusus. Mulai dengan memilih “New tuned model” di panel menu sebelah kiri.

gambar bergerak yang menunjukkan cara membuat model yang disesuaikan di Google AI Studio dengan membuka 'New tuned model' dari menu

2. Pilih data yang akan disesuaikan

Anda dapat menyesuaikan model dari prompt terstruktur yang sudah ada atau mengimpor data dari Google Spreadsheet atau file CSV. Anda dapat memulai dengan sedikitnya 20 contoh dan agar bisa mendapatkan performa terbaik, kami sarankan untuk menyediakan set data yang terdiri dari setidaknya 100 contoh.

gambar bergerak yang menunjukkan cara memilih data yang akan disesuaikan di Google AI Studio dengan mengimpor data

3. Lihat model yang disesuaikan

Lihat progres penyesuaian di library Anda. Setelah model selesai disesuaikan, Anda dapat melihat detailnya dengan mengklik model. Mulai jalankan model yang telah disesuaikan melalui prompt terstruktur atau freeform.

gambar bergerak yang menunjukkan cara melihat model yang telah disesuaikan di Google AI Studio dengan mengimpor data

4. Jalankan model yang telah disesuaikan kapan saja

Anda juga bisa mengakses model yang baru disesuaikan dengan membuat prompt terstruktur atau freeform baru dan memilih model yang disesuaikan dari daftar model yang tersedia.

gambar bergerak yang menunjukkan bagaimana menjalankan model yang telah disesuaikan di Google AI Studio setelah mengimpor data

Menyesuaikan dengan Gemini API

Google AI Studio adalah cara tercepat dan termudah untuk mulai menyesuaikan model Gemini. Anda juga dapat mengakses fitur ini melalui Gemini API dengan memberikan data pelatihan dalam permintaan API saat membuat model yang disesuaikan. Pelajari lebih lanjut tentang cara memulainya di sini.

Kami sangat antusias untuk menyaksikan terbukanya berbagai kemungkinan dengan adanya penyesuaian bagi developer dan tidak sabar untuk melihat kreasi yang akan Anda buat dengan fitur ini. Jika Anda memiliki ide atau kasus penggunaan, bagikan dengan kami di X (sebelumnya dikenal sebagai Twitter) atau Linkedin.



Diposting oleh Thomas Ezan – Sr. Developer Relations Engineer; Chengji Yan, Penny Li – ML Kit Engineers; David Miro Llopis – Product Manager

Kami sangat gembira mengumumkan diluncurkannya ML Kit Document Scanner API. API baru ini memudahkan penambahan kemampuan pemindaian dokumen tingkat lanjut dengan antarmuka pengguna berkualitas tinggi dan konsisten ke aplikasi Android Anda. ML Kit Document Scanner API memungkinkan pengguna Anda mendigitalkan dokumen kertas dengan cepat dan mudah.

Seperti ML Kit API lainnya, ML Kit Document Scanner API memungkinkan Anda mengintegrasikan fitur-fitur yang didukung oleh Machine Learning (ML) dengan lancar tanpa pengetahuan ML apa pun.

ilustrasi ml kit document scanner

Mengapa harus Document Scanner SDK?

Meskipun terjadi revolusi digital, dokumen kertas dan hasil cetakan masih ada dalam kehidupan kita sehari-hari. Beberapa dokumen terpenting kita masih dalam bentuk fisik (dokumen identitas, resi, dll).

ML Kit Document Scanner API menawarkan sejumlah manfaat, termasuk:

    • Antarmuka pengguna berkualitas tinggi dan konsisten untuk mendigitalisasi dokumen fisik.
    • Deteksi dokumen yang akurat dengan deteksi sudut dan tepi yang presisi untuk pengalaman pemindaian yang lancar dan hasil pemindaian yang optimal.
    • Fungsionalitas fleksibel memungkinkan pengguna memotong dokumen yang dipindai, menerapkan filter, menghilangkan jari, menghilangkan noda dan kotoran lainnya, serta mengirimkan kembali file digital dalam format PDF dan JPEG ke aplikasi Anda.
    • Pemrosesan di perangkat membantu menjaga privasi.
    • Solusi lengkap yang meniadakan keharusan izin kamera.

ML Kit Document Scanner API sudah digunakan oleh aplikasi Android Google Drive dan Google Pixel Camera.

gambar bergerak yang menampilkan aksi ML Kit Document scanner API di Google Drive
Aksi ML Kit Document scanner API di Google Drive

Mulai

ML Kit Document Scanner API memerlukan Android API level 21 atau lebih tinggi. Model, logika pemindaian, dan alur UI diunduh secara dinamis melalui layanan Google Play sehingga ML Kit Document Scanner API memiliki dampak minimal terhadap ukuran aplikasi Anda.

Untuk mengintegrasikannya ke dalam aplikasi Anda, mulailah dengan mengonfigurasi opsi pemindai dan mendapatkan klien pemindai:

val options = GmsDocumentScannerOptions.Builder()
    .setGalleryImportAllowed(false)
    .setPageLimit(2)
    .setResultFormats(RESULT_FORMAT_JPEG, RESULT_FORMAT_PDF)
    .setScannerMode(SCANNER_MODE_FULL)
    .build()
val scanner = GmsDocumentScanning.getClient(options)

Kemudian daftarkan ActivityResultCallback untuk menerima hasil pemindaian:

val scannerLauncher = registerForActivityResult(StartIntentSenderForResult()) {
  result -> {
    if (result.resultCode == RESULT_OK) {
      val result =
        GmsDocumentScanningResult.fromActivityResultIntent(result.data)
      result.getPages()?.let { pages ->
        for (page in pages) {
          val imageUri = page.getImageUri()
        }
      }
      result.getPdf()?.let { pdf ->
        val pdfUri = pdf.getUri()
        val pageCount = pdf.getPageCount()
      }
    }
  }
}

Terakhir, luncurkan aktivitas pemindai dokumen:

scanner.getStartScanIntent(activity)
  .addOnSuccessListener { intentSender ->   
    scannescannerrLauncher.launch(IntentSenderRequest.Builder(intentSender).build())
  }
  .addOnFailureListener { ... }

Untuk memulai ML Kit Document Scanner API, kunjungi dokumentasi. Kami tidak sabar untuk melihat apa yang akan Anda lakukan dengan API ini!