هوش مصنوعی جمینی (Gemini) و آموزش + کاربردهای آن


هوش مصنوعی جمینی (Gemini) و آموزش استفاده از آن به چه شکل است؟ اگر شما هم قصد دارید از این نوع هوش مصنوعی استفاده کنید و از طریق آن برای تولید محتوا، تعامل، پاسخ به سوالات مخاطبان و استفاده از api آن اقدام کنید، تا انتهای این مقاله با ما همراه باشید.
آشنایی با هوش مصنوعی مبتنی بر چت
تقریبا از انتهای سال 2020 بود که با آمدن هوش مصنوعی ChatGPT، عصر شگفت انگیز هوش مصنوعی آغاز شد. در این زمان قبل از اینکه هوش مصنوعی های مربوط به حوزه گرافیک و ویدیو رونمایی شوند، شاهد عرضه هوش های مصنوعی مبتنی بر چت بودیم. قبل از اینکه بخواهیم به هوش مصنوعی جمینی (Gemini) و آموزش استفاده از آن از آن بپردازیم، می بایست با این نوع هوش مصنوعی ها آشنا شوید که در این خصوص باید گفت:
- چت بات ها، نرم افزارهایی هستند که می توانید با آنها از طریق گفتگوهای متنی، تعامل داشته باشید. این نوع سیستم ها از هوش مصنوعی استفاده می کنند و می تواند به زبان طبیعی انسان ها پاسخ داده و همانند یک انسان رفتار کنند. علت این موضوع، بهره مندی آنها از تکنولوژی هایی همچون یادگیری عمیق و نیز پردازش زبان طبیعی می باشد.
سابقه وجود چت بات ها از سال 1960 میلادی به بعد می باشد اما در نوع امروزی آن که صحبت می کنیم، به اوایل دهه 2020 میلادی باز می گردد. زمانی که ChatGPT از OpenAI ایجاد شد و سلسله چت بات های مبتنی بر هوش مصنوعی نظیر مایکروسافت کوپایلت، دیپ سیک و هوش مصنوعی جمینی از گوگل را ایجاد کرد.
امروزه کاربردهای هوش مصنوعی مبتنی بر چت شامل موارد متعددی است که در ادامه چند مورد مهم آن را ذکر می کنیم:
- پشتیبانی از مخاطبان: امروزه شرکت ها برای پاسخگویی به سوالات متداول کاربران، به جای استفاده از کارشناسان، از چت بات های هوشمند استفاده می کنند. با در اختیار دادن یک بانک اطلاعاتی کامل در مورد خدمات و موضوعات مختلف و ارائه سابقه گفتگوها، این چت بات ها برای پاسخگویی به سوالات کاربران تربیت می شوند.
- عیب یابی: چت بات ها با منابع اطلاعاتی بزرگی Train شده اند. در نتیجه شاهد آن هستیم که می توانند در کنار تکنولوژی های دیگر هوش مصنوعی، برای عیب یابی مشکلات کاربران استفاده گردند.
- تحلیل و آنالیز متن: این چت بات ها می توانند محتواهای متن ارسالی را آنالیز کرده و تحلیل کنند. سپس نتیجه گیری نموده و به سوالات کاربران پاسخ دهند.
- ترجمه: این چت بات ها می توانند با تکنولوژی هایی همچون پردازش زبان طبیعی (NLP) و مدل های یادگیری عمیق، برای ترجمه متون به زبان های مختلف با دقت بالا اقدام کنند.
شما کاربران می توانید در مقاله بهترین سایت هوش مصنوعی، سایت های کاربردی AI را مطالعه کنید.
معرفی هوش مصنوعی گوگل جمینی
حال می خواهیم به یکی از محبوب ترین هوش مصنوعی های ارائه شده توسط شرکت گوگل اشاره کنیم که اولین بار در فوریه سال 2023 ارائه شد. بد نیست بدانید که این هوش مصنوعی، آپدیت های مختلفی دریافت کرده که یک مورد آن همین امروز (در زمان نگارش این مقاله) منتشر شده است و امکان ارائه تصاویر از زاویه های مختلف با نمونه برداری از یک تصویر ارسالی را دارد. در ادامه بیشتر راجع به قابلیت های این AI می پردازیم.
این هوش مصنوعی از طریق وب سایت https://gemini.google.com قابل دسترسی می باشد. با این حال برای دسترسی به آن، باید از برنامه تغییر دهنده آی پی استفاده کرده و نیز یک اکانت جیمیل برای ثبت نام داشته باشید.
گوگل با پیشرفت فناوری مدل زبانی خود، یک هوش مصنوعی مولد چت بات را ارائه کرد که در ابتدا با نام Bard شناخته می شد. دقیقا یکسال بعد بود که این تغییر نام به Gemini اعمال شد و علت آن، یکپارچه شدن دو سرویس بارد و Duet AI با یکدیگر بود. شما می توانید در مورد هوش مصنوعی گوگل بارد و نحوه استفاده از آن در این مقاله بیشتر مطالعه داشته باشید.
Gemini یک مدل زبان بزرگ یا LLM است که هدف آن درک صحبت کاربران و تولید محتوای متنی مانند انسان ها می باشد. شما می توانید از آن برای دریافت پاسخ های خلاقانه، سوالات یا ابهامات خود، تولید محتوای خلاقانه و مواردی که در بخش قبل بیان کردیم، استفاده کنید.
آپدیت های گوگل جمینی
در خصوص آپدیت هایی که برای گوگل جمینی منتشر شده است، می توان به برخی موارد زیر اشاره کرد:
- دسترسی به مدل جمینی 5 Flash که می تواند برای دریافت پاسخ های سریعتر و مفیدتر در بیش از 40 زبان و 230 کشور استفاده شود.
- دسترسی به مدل جمینی 5 Pro که می توانید به کمک آن برای درک اسناد بزرگتر (تا حداکثر 1500 صفحه در مجموع) یا 100 ایمیل استفاده کنید. همچنین از دیگر قابلیت های این مدل می توان به آنالیز بیش از 30 هزار خط کد و محتوای 1 ساعته ویدیویی اشاره کرد.
- توانایی صحبت با این هوش مصنوعی که از طریق ویژگی Gemini Live قابل دسترسی است.
بد نیست بدانید که در آخرین پیشرفت هوش مصنوعی جمینی (Gemini) و آموزش استفاده از آن، یک قابلیت جذاب ارائه شده است. در این نسخه، گوگل جمینی 2 که اکنون برای عموم مردم در دسترس است، قابلیت های زیر را شاهد هستیم:
- Dreamer New Tool Tool: ابزاری که علایق شما را بررسی کرده و می تواند با توجه به مهارت ها، به شما در شناسایی شغل مناسب تان کمک کند.
- فیچر Flash Experimental که می توانید هر نوع عکسی را به هوش مصنوعی بدهید و از او بخواهید تا آن را به شیوه ای مختلف ادیت کند. مثلا شما می توانید تصویر دوست خود را بدهید و از گوگل جمینی بخواهید تا او را در حالی که کت و شلواری پوشیده و عکس سلفی از خود می گیرد، به نمایش بگذارد. البته برای این قابلیت باید به سایت https://aistudio.google.com بروید.
ویژگی های هوش مصنوعی گوگل Gemini
برای درک بهتر اینکه هوش مصنوعی جمینی (Gemini) و آموزش استفاده از آن به چه شکل است، بد نیست ابتدا با ویژگی های این هوش مصنوعی آشنا شوید. در این خصوص باید گفت:
رایگان بودن
یکی از ویژگی های خوب این چت بات و هوش مصنوعی، رایگان بودن آن است. در واقع شما می توانید به صورت کاملا رایگان، از فیچرهای آن به صورت محدود استفاده کنید. توجه نمایید که حتی گوگل آفر صفر یورو برای کاربران جدید را ارائه کرده است. یعنی کسانی که جدیدا پلن این هوش مصنوعی را می خرند، در ماه اول رایگان و به صورت Pro از آن استفاده خواهند کرد.
شما می توانید در نسخه رایگان، از مدل های مختلفی نظیر 2.0 Flash model, and 2.0 Flash Thinking experimental که جزو مدل های جدید این ai است نیز استفاده کنید.
گفتگوی صوتی
یکی دیگر از ویژگی های خوب این هوش مصنوعی، استفاده از قابلیت Gemini Live است که می تواند یک دستیار صورتی تمام عیار برای شما باشد. شما می توانید مکالماتی همانند یک انسان با او داشته باشید.
امکان کدنویسی
شما می توانید از قابلیت دیباگ و کدنویسی این هوش مصنوعی استفاده کنید. به خصوص در پلن پولی که روند انجام این کار سریعتر می باشد.
امکان آنالیز کردن
این هوش مصنوعی قابلیت تحلیل کردن را دارد. به عنوان مثال شما می توانید یک فایل پی دی اف یا تصویر و متن را به آن ارائه کرده و از او بخواهید برای تحلیل محتوا و پاسخ به سوالات منطبق بر آن اقدام کند.
امکان دسترسی با API
یکی از ویژگی های خوب این هوش مصنوعی آن است که می توانید از طریق APIهای آن، برای دسترسی به امکانات این چت بات اقدام کنید. استفاده از آخرین مدل ها و فراهم بودن محتوای کامل برای آگاهی از نحوه استفاده از آنها در Gemini API SDKs، ارائه این قابلیت در زبان های مختلف مانند Python, Node.js, Go, Dart، اندروید و غیره از جمله فیچرهای خوب این قابلیت هستند.
هوش مصنوعی جمینی (Gemini) و آموزش استفاده از آن
حال در بخش سوم از هوش مصنوعی جمینی (Gemini) و آموزش استفاده از آن می خواهیم در رابطه با استفاده از این AI، تکنیک هایی را بیان کرده و امکانات آن را برای شما معرفی کنیم. در این خصوص می توان گفت:
چت کردن
اولین گام آن است که شما برای پرامپت نویسی و چت کردن با این هوش مصنوعی اقدام کنید. توجه نمایید که برای انجام این کار، بسیار مهم است که دستورات را به طور دقیق و جامع بیان کنید. راحت ترین راه برای کسانی که نمی دانند چطور پرامپت نویسی کنند، آن است که از خود هوش مصنوعی بخواهند در مورد موضوعی که سوال دارند، بهترین پرامپت را بدهد. سپس آن پرامپت را مجددا از گوگل جیمنی پرسیده و از این طریق، پاسخ دقیقی را بگیرند.
مثلا شما می توانید به جای بیان اینکه بپرسید “چگونه یک بیزینس فروش لپ تاپ های کارکرده را راه بیندازیم”، از هوش مصنوعی بخواهید تا “در 10 گام، روند راه اندازی این کسب و کار را در بخش های تحقیق در مورد مارکت، بیزینس پلن، یافتن منابع خرید کالا، بخش کنترل کیفیت، مجوزهای لازم، استراتژی مارکتینگ، راه اندازی کسب و کار به صورت آنلاین و … بیان کند”.
توضیحات بیشتر راجع به نحوه سوال پرسیدن از هوش مصنوعی و چگونگی پرامپت نویسی را در این مقاله برای شما بیان کرده ایم.
استفاده در گوگل داک
شما می توانید اسناد خود در گوگل داکیومنت را به گوگل جمینی متصل کنید. در این حالت می توانید از او بخواهید برخی پاراگراف ها را که از نظر شما درست نگارش نشده اند، بهینه سازی کند. مثلا شما یک سناریو برای ویدیو خود نگارش کرده اید و از میان 6 مرحله، مرحله 3ام را بهینه سازی می کنید.
استفاده در جیمیل
شما می توانید از گوگل جمینی در جیمیل خود استفاده کنید. یک پیام جدید ایجاد کرده و از قسمت پایین روی گزینه مداد یا Help me Write کلیک کنید. حال می توانید یک پرامپت بنویسید و از این هوش مصنوعی بخواهید تا مثلا در مورد کمپین فروش عید نوروز راجع به محصول x با تخفیف 30%، یک متن بنویسد.
استفاده در SpreadSheet
این امکان برای شما وجود دارد که از هوش مصنوعی جمینی (Gemini) و آموزش استفاده از آن در اکسل گوگل استفاده کنید. در این حالت روی گزینه Help me Organize کلیک کرده و می توانید در قسمت پرامپت نویسی، از او بخواهید تا یک تقویم محتوایی ایجاد کند به صورتی که حول یک کلمه کلیدی خاص تمرکز کند. مثلا پرامپت زیر:
Plan a month’s worth of blog post ideas focusing on top searched question around of “xxxxx (subject)”. Organize it by content pillars and add a spot to link the scripts.
ساخت تصاویر در گوگل جمینی
شما می توانید با دستورات و پرامپت نویسی، امکان ساخت تصاویر را از این هوش مصنوعی نیز داشته باشید که در آینده قرار است پیشرفت خوبی کند. مثلا می توانید بنویسید create and image of laptop.
استفاده در گوگل اسلاید
شما می توانید از این هوش مصنوعی برای ایجاد گوگل اسلاید نیز استفاده کنید. در این حالت کافیست یک پرامپت بنویسید و از او بخواهید تا یک پرزنتیشن در یک موضوع خاص را به شما ارائه کند.
از دیگر ایده های استفاده از هوش مصنوعی جمینی (Gemini) و آموزش استفاده از آن می توان گفت:
- خلاصه نویسی در گوگل میتینگ از سوی افراد مختلف به صورت زنده.
- جستجوی ویدیوها در یوتیوب در رابطه با یک موضوع خاص.
- شما می توانید محتواهای ویدیوهای یوتیوب را با این ابزار بررسی کنید.
آموزش استفاده از جمینی با استفاده از API
همانطور که گفتیم، شما می توانید از امکانات هوش مصنوعی جمینی (Gemini) و آموزش استفاده از آن با کمک API اقدام کنید. در این حالت ابتدا وارد سایت https://ai.google.dev/ شده و می توانید برای کسب اطلاعات بیشترف گزینه View Gemini API docs را بزنید.
حال راحت ترین حالت آن است که از پایتون استفاده کنید و با نصب نسخه python که در صفحه راهنما گفته شده است (معمولا پایتون +3.9)، دستورات مربوطه را تایپ کرده و می توانید پکیج های لازم برای استفاده از api google gemini را نصب کنید.
شما می توانید این کد را در ترمینال برنامه vscode یا pycharm قرار داده و عملیات نصب را به کار ببرید.
در خصوص اینکه چگونه api گوگل جمینی را بگیریم، کافیست مراحل زیر را طی کنید:
- google.com را جستجو کنید.
- حال بر روی گزینه Get API Key را بزنید.
- سپس می توانید روی گزینه Create API Key را بزنید.
حال کد مربوطه را در کد پایتون قرار بدهید و کد را در برنامه مربوطه paste کرده و اجرا کنید. کار تمام است و می توانید با گوگل جمینی در برنامه خود صحبت کنید.
دیدگاهتان را بنویسید