تشهد تقنيات الذكاء الاصطناعي من جوجل قفزة نوعية مع إطلاق Gemini 2.5 Flash (المعروف أيضًا باسم nano-banana)، وهو النموذج الأحدث من Google DeepMind لتوليد الصور وتحريرها. ويوفر هذا النموذج للمستخدمين مزيجًا من السرعة، والجودة العالية، والتحكم السلس، ويُصنَّف كأحد أقوى نماذج تحرير الصور في العالم.
وفي الوقت الحالي، أصبح هذا النموذج متاحًا مباشرة عبر تطبيق Gemini، بالإضافة إلى أداة Google AI Studio للمطورين، ومنصة Vertex AI للشركات؛ مما يجعله في متناول المستخدمين من مُختلف الفئات.
إليك كل ما تحتاج إلى معرفته عن نموذج Gemini 2.5 Flash الأحدث من جوجل لتوليد الصور:
أطلقت جوجل في وقت سابق مزية لتحرير الصور الأصلية داخل تطبيق Gemini، ومنذ ذلك الحين عملت على تحسينها بنحو كبير. ومع إطلاق Gemini 2.5 Flash ركزت الشركة في الحفاظ على اتساق مظهر الشخصيات والعناصر الأساسية عند توليد مجموعة صور تتضمن العناصر نفسها بأوضاع مختلفة، وهو أمر مهم عند تحرير صور الأشخاص أو المنتجات أو الحيوانات الأليفة.
وهذا التحديث الجديد يتيح لك:
يتمتع النموذج الجديد من جوجل بمزايا متقدمة لتحرير الصور وتوليدها تجعله مناسبًا للمبدعين، وأبرزها:
سواء كنت تنشئ حملة إعلانية أو أصولًا بصرية لعلامة تجارية، يمكنك الاستعانة بنموذج Gemini 2.5 Flash لإنشاء صور متعددة للمنتج نفسه أو الشخصية نفسها في سياقات متعددة، مع الحفاظ على الهوية البصرية نفسها دائمًا.
باستخدام اللغة الطبيعية، يمكنك طلب إجراء تعديلات دقيقة مثل:
على عكس النماذج التقليدية التي تفتقر إلى فهم السياق، يستفيد Gemini 2.5 Flash من قاعدة معرفية عميقة بالبيئة الحقيقية؛ مما يتيح استخدامه لتحويل الرسومات إلى مشاهد واقعية تفاعلية، كما يمكن استخدامه في مجالي تصميم الأزياء والتصميم الداخلي، كأن تطلب منه إعادة تصميم الغرف بما يتماشى مع توجهات الموضة فيما يتعلق بالأثاث والديكور.
يمكنك إدخال عدة صور وطلب دمجها في صورة واحدة، كأن تطلب وضع منتج معين خلفية جديدة، أو إنشاء صورة تسويقية لمتجر إلكتروني تدمج عدة صور للمنتجات المتوفرة في المتجر.
يتوفر نموذج Gemini 2.5 Flash الآن للمطورين والشركات بسعر يبلغ 30 دولارًا لكل مليون رمز إخراج (output tokens). وتوليد صورة واحدة يعادل نحو 1290 رمز (أي ما يقارب 0.039 دولار فقط للصورة).
وفي تطبيق Gemini، يمكن لجميع المستخدمين تجربة القدرات الجديدة للنموذج مباشرة عبر المطالبات النصية، وجميع الصور المُنشأة أو المعدلة عبر التطبيق تتضمن علامة مائية مرئية، بالإضافة إلى العلامة الرقمية SynthID غير المرئية، لتوضيح أنها من إنتاج الذكاء الاصطناعي.
اقرأ ايضا: فيسبوك يستخدم الصور الموجودة فى هاتفك لتدريب الذكاء الاصطناعي Meta AI
إليك بعض الصورة التي نشرتها شركة جوجل لتوضيح قدرات نموذجها الجديد على توليد الصور وتحريرها:
المطالبة: غيّر القطعة الظاهرة على الرأس إلى شيء مصنوع من الزهور الحمراء.
المطالبة: أنشئ 5 صور للفتاة موضوعة على طاولة نظيفة، وكلها تظهر فيها وهي ترتدي أزياء مختلفة من الثمانينيات.
المطالبة الأولى: أظهر هذا الرجل كمعلم. المطالبة الثانية: أظهر هذا الرجل كنحات. المطالبة الثالثة: أظهر هذا الرجل كممرض. المطالبة الرابعة: أظهر هذا الرجل كخباز.
المطالبة: امزج الصورتين معًا.
المطالبة: اجعل الرجل يحتضن الكلب.
المطالبة: غيّر اللون الأزرق إلى اللون الأخضر.
المطالبة: اجعل الطقس يبدو جيدًا في الصورة.
المطالبة الأولى: اجعل المنزل مطلي باللون الأبيض. المطالبة الثانية: أضف أحواض زهور تحتوي على أزهار زاهية أمام المنزل. المطالبة الثالثة: أضف أجواء خريفية حول المنزل. المطالبة الرابعة: اجعل جو الصورة شتوي وزيّن المنزل.
المطالبة: اجعل هذا الطائر يظهر باللون الأحمر مع القليل من اللون الأخضر الزمردي.
المطالبة: أعد ترميم الصورة.
المطالبة: أعد تصميم غرفة المعيشة بأسلوب جديد من خلال دمج عينات الألوان المرفقة في أجزاء مختلفة من الغرفة.
