وب سایت تخصصی شرکت فرین
دسته بندی دوره ها

Introduction to Multimodal Prompting for Generative AI

سرفصل های دوره

In the last year, multimodality has brought about new capabilities to AI systems. In this course, software developer and instructor Ronnie Sheer offers you an understanding of what multimodality is and when and why it may be leveraged for business needs. Dive into a "tools approach" as Ronnie teaches you multimodality using two popular LLMs on the market: GPT-4 and Google Gemini. Plus, explore an additional chapter dedicated to prompting with and for music. Solidify all that you learn in the course, using opportunities within the course for hands-on practice.


01 - Introduction
  • 01 - GenAI with multimodal prompts

  • 02 - 1. Multimodality
  • 01 - What is multimodality
  • 02 - Visual modality
  • 03 - Textual and auditory modality

  • 03 - 2. GPT-4
  • 01 - GPT-4 and 4o
  • 02 - Text to image in GPT-4
  • 03 - GPT-4 API with various input types
  • 04 - Challenge Drawing to code
  • 05 - Solution Drawing to code

  • 04 - 3. Gemini
  • 01 - What is Gemini
  • 02 - Images in Gemini
  • 03 - Gemini video inputs
  • 04 - Challenge Video narration
  • 05 - Solution Video narration

  • 05 - 4. Auditory Modalities
  • 01 - Audio in generative AI
  • 02 - Prompt and audio
  • 03 - Generating music
  • 04 - Challenge Soundtrack creation
  • 05 - Solution Soundtrack creation

  • 06 - Conclusion
  • 01 - Next steps
  • 139,000 تومان
    بیش از یک محصول به صورت دانلودی میخواهید؟ محصول را به سبد خرید اضافه کنید.
    خرید دانلودی فوری

    در این روش نیاز به افزودن محصول به سبد خرید و تکمیل اطلاعات نیست و شما پس از وارد کردن ایمیل خود و طی کردن مراحل پرداخت لینک های دریافت محصولات را در ایمیل خود دریافت خواهید کرد.

    ایمیل شما:
    تولید کننده:
    مدرس:
    شناسه: 39709
    حجم: 84 مگابایت
    مدت زمان: 39 دقیقه
    تاریخ انتشار: 22 مرداد 1403
    طراحی سایت و خدمات سئو

    139,000 تومان
    افزودن به سبد خرید