GPT ইমেজ 1.5 এর মাধ্যমে ChatGPT ইমেজ তৈরির গতি বাড়ায়

  • জিপিটি ইমেজ ১.৫ আপনাকে আগের ভার্সনের তুলনায় চারগুণ দ্রুত গতিতে ছবি তৈরি করতে সাহায্য করে।
  • এই আপডেটটি ভিজ্যুয়াল ফিডেলিটি, নির্দেশনা ট্র্যাকিং এবং নির্দিষ্ট উপাদানের সুনির্দিষ্ট সম্পাদনা উন্নত করে।
  • ChatGPT Images স্টাইল, প্রিসেট এবং পরামর্শ সহ নিজস্ব স্থান চালু করে, যা বিনামূল্যে অ্যাকাউন্টেও অ্যাক্সেসযোগ্য।
  • নতুন মডেলটি API খরচ কমায় এবং ডিজাইন, মার্কেটিং এবং ই-কমার্সে পেশাদার ব্যবহারের জন্য তৈরি।

ChatGPT দিয়ে ছবি তৈরি করা

নতুন আপডেটের মাধ্যমে এআই-চালিত ইমেজ জেনারেশন আরও এক ধাপ এগিয়েছে চ্যাটজিপিটি ছবিওপেনএআই তার ভিজ্যুয়াল সিস্টেমকে সম্পূর্ণরূপে পুনর্গঠন করেছে একটি মডেল দিয়ে যা জিপিটি চিত্র ১.৫যা দ্রুত ফলাফল, সম্পাদনার উপর অধিক নিয়ন্ত্রণ এবং কম্পিউটার এবং মোবাইল উভয় ডিভাইসেই আরও আরামদায়ক ব্যবহারকারীর অভিজ্ঞতার প্রতিশ্রুতি দেয়।

এই আপডেটটি গুগলের ভিজ্যুয়াল মডেলের মতো অন্যান্য প্ল্যাটফর্মগুলির তীব্র প্রতিযোগিতার মধ্যে এসেছে এবং এর লক্ষ্য হল দৈনন্দিন ব্যবহারের জন্য একটি সৃজনশীল হাতিয়ার হিসেবে ChatGPT-এর ভূমিকাকে আরও শক্তিশালী করা। কোম্পানির মতে, নতুন সিস্টেমটি সক্ষম চারগুণ দ্রুত চিত্র তৈরি করুন পূর্ববর্তী সংস্করণের তুলনায়, একই ছবির বিভিন্ন সংস্করণের মধ্যে ভিজ্যুয়াল মান এবং ধারাবাহিকতা বজায় রাখা বা এমনকি উন্নত করা।

অ্যাডোবি চ্যাটজিপিটিতে ফটোশপ এক্সপ্রেস এবং অ্যাক্রোব্যাটকে একীভূত করে
সম্পর্কিত নিবন্ধ:
চ্যাটে সৃজনশীল সম্পাদনা আনতে অ্যাডোব চ্যাটজিপিটিতে ফটোশপ, এক্সপ্রেস এবং অ্যাক্রোব্যাটকে একীভূত করে।

জিপিটি ইমেজ ১.৫: গুণমান নষ্ট না করেই চারগুণ দ্রুত ছবি তোলা

GPT ইমেজ 1.5 এর সাথে, OpenAI দাবি করে যে ChatGPT-তে ছবি তৈরি এখন ৪ গুণ দ্রুততর আগের তুলনায়। কর্মক্ষমতার এই উল্লম্ফন বিশেষ করে এমন পরিস্থিতিতে লক্ষণীয় যেখানে ব্যবহারকারীকে পরপর বেশ কয়েকটি পরীক্ষা চালাতে হয়, তা সে পেশাদার প্রকল্পের জন্য হোক বা সোশ্যাল মিডিয়ার জন্য কন্টেন্ট তৈরির জন্য।

এখন পর্যন্ত, ChatGPT Images এর সবচেয়ে বড় অসুবিধাগুলির মধ্যে একটি ছিল অপেক্ষার সময়কাল: প্রথম ছবিটি পেতে আমাদের বেশ কিছুক্ষণ অপেক্ষা করতে হয়েছিল। আর যদি ফলাফল সন্তোষজনক না হয় অথবা কিছু বিশদ সমন্বয়ের প্রয়োজন হয়, তাহলে এর অর্থ হল আবার একই প্রক্রিয়ার মধ্য দিয়ে যেতে হবে। নতুন মডেলটি এই সময়গুলিকে উল্লেখযোগ্যভাবে হ্রাস করে এবং আরও চটপটে পুনরাবৃত্তির সুযোগ দেয়, যা সৃজনশীল বা বাণিজ্যিক কর্মপ্রবাহের ক্ষেত্রে অত্যন্ত গুরুত্বপূর্ণ।

ওপেনএআই জোর দিয়ে বলে যে এই অতিরিক্ত গতির ফলে দৃশ্যমান আপস হয় না। বিপরীতে, জিপিটি ইমেজ ১.৫ উন্নতি প্রবর্তন করে নির্দেশাবলীর প্রতি বিশ্বস্ততা, সংস্করণগুলির মধ্যে ধারাবাহিকতা এবং বিশদের স্পষ্টতারঙের পরিবর্তন, আলোর সমন্বয়, অথবা খুব নির্দিষ্ট অবস্থানে বস্তুর অন্তর্ভুক্তি পূর্ববর্তী মডেলগুলির তুলনায় আরও ভালভাবে সংরক্ষিত।

অধিকন্তু, কোম্পানি সিদ্ধান্ত নিয়েছে যে এই উন্নতিগুলি তাদের কাছেও পৌঁছাবে যারা বিনামূল্যে ChatGPT ব্যবহার করেন।নতুন মডেলটি পূর্ববর্তী প্রজন্মের যেমন DALL·E অথবা GPT Image 1 কে প্রতিস্থাপন করে এবং নিয়মিত চ্যাট ইন্টারফেস এবং ডেভেলপার API উভয় ক্ষেত্রেই ডিফল্ট বিকল্প হিসেবে সংহত করা হয়েছে।

ChatGPT-এর মধ্যে "ফটোশপ"-স্টাইলের সম্পাদনা দেখুন

গতির বাইরে, যে ক্ষেত্রগুলিতে পরিবর্তনগুলি সবচেয়ে বেশি লক্ষণীয় তা হল একটি ছবির নির্দিষ্ট অংশের নির্বাচনী সম্পাদনাঐতিহাসিকভাবে, জেনারেটিভ এআই মডেলগুলি বাকিগুলি পরিবর্তন না করে কেবল একটি উপাদান পরিবর্তন করতে লড়াই করেছে, যার ফলে প্রতিটি পরিবর্তনের সাথে সাথে চিত্রটি পুনরায় তৈরি করতে বাধ্য হয়েছে।

  কোপাইলট দিয়ে স্ক্রিপ্ট তৈরি: ধাপে ধাপে তৈরি থেকে ডিবাগিং পর্যন্ত

নতুন ChatGPT ইমেজগুলি প্রায় এরকম কাজ করে AI দ্বারা সমন্বিত এবং পরিচালিত একটি ছোট "ফটোশপ"ব্যবহারকারী নির্দিষ্ট এলাকা নির্বাচন করতে পারেন এবং খুব নির্দিষ্ট পরিবর্তনের জন্য অনুরোধ করতে পারেন: একটি পোশাকের রঙ পরিবর্তন করতে, একটি বস্তু প্রতিস্থাপন করতে, একটি নির্দিষ্ট এলাকার আলো পুনর্নির্মাণ করতে, অথবা বিভিন্ন ছবির উপাদানগুলিকে একটি একক রচনায় একত্রিত করতে।

এই টুলটি আরও অফার করে প্রস্তাবিত স্টাইল এবং প্রিসেটযারা জটিল প্রম্পট মোকাবেলা করতে চান না তাদের জন্য ডিজাইন করা হয়েছে। একটি রেফারেন্স ছবি দিয়ে শুরু করে, পোশাক, চুলের স্টাইল, প্রেক্ষাপট বা পরিবেশের বৈচিত্র্য তৈরি করা যেতে পারে, মুখের বৈশিষ্ট্য বিকৃত না করে বা গুরুত্বপূর্ণ বিবরণ না হারিয়ে মূল ব্যক্তি বা পণ্যের পরিচয় বজায় রেখে।

ওপেনএআই-এর মতে, এটি নিশ্চিত করার জন্য বিশেষ কাজ করা হয়েছে যে সংস্করণটি লোগো, ব্র্যান্ড উপাদান এবং অন্যান্য গুরুত্বপূর্ণ বিবরণকে সম্মান করেএটি মার্কেটিং, ই-কমার্স, অথবা ডিজাইন টিমের জন্য খুবই প্রাসঙ্গিক যাদের ক্যাটালগ, ব্যানার বা বিজ্ঞাপনে একটি ধারাবাহিক ভিজ্যুয়াল স্টাইল বজায় রাখতে হবে।

নির্দেশাবলী অনুসরণ করলে আরও নির্ভুলতা এবং ছবির মধ্যে আরও ভালো লেখা

আরেকটি ক্ষেত্র যেখানে GPT ইমেজ 1.5 এগিয়ে যাওয়ার চেষ্টা করে তা হল জটিল নির্দেশাবলী কঠোরভাবে অনুসরণ করাপূর্ববর্তী সংস্করণগুলিতে, বস্তু, অবস্থান বা পরিমাণের মধ্যে একটি নির্দিষ্ট সম্পর্কের অনুরোধ করা এবং মডেলটি উপাদানের সংখ্যা থেকে শুরু করে স্থানের বন্টন পর্যন্ত কিছু বিশদে ভুল থাকার অনুরোধ করা সাধারণ ছিল।

ওপেনএআই তুলনা দেখায় যেখানে নতুন সিস্টেমটি আরও ভালোভাবে সম্মান করে গ্রিড কাঠামো, সুনির্দিষ্ট স্থানিক সম্পর্ক, অথবা অনেক সংজ্ঞায়িত উপাদান সহ রচনাএটি বিশেষ করে শিক্ষামূলক উদ্দেশ্যে, ভিজ্যুয়াল ডায়াগ্রাম, ইন্টারফেস মকআপ, বা তথ্যমূলক উপকরণের জন্য কার্যকর যেখানে ত্রুটি কেবল নান্দনিক নয় বরং কার্যকরীও।

উন্নতিগুলিও চালু করা হয়েছে ছবিতে একত্রিত টেক্সট রেন্ডারিংএটি এমন একটি বিষয় যা প্রায় সকল জেনারেটিভ মডেলের ক্ষেত্রেই একটা সমস্যা হিসেবে রয়ে গেছে। GPT Image 1.5 এখন ঘন টেক্সট ব্লক, ছোট ফন্ট, এমনকি টেবিল বা পোস্টার-স্টাইল লেআউটের মতো কাঠামোও পরিচালনা করে, যেখানে যুক্তিসঙ্গত, যদিও এখনও নিখুঁত নয়, পঠনযোগ্যতা রয়েছে।

এই অগ্রগতি আরও ব্যবহারের ক্ষেত্রে দরজা খুলে দেয়: বিজ্ঞাপনের পোস্টার, সোশ্যাল মিডিয়া বিজ্ঞাপন, মার্কেটিং সৃজনশীলতা, ইনফোগ্রাফিক্স, অথবা সম্পাদকীয় লেআউট প্রোটোটাইপAI এখনও সমস্ত লেবেল ১০০% সঠিকভাবে বুঝতে পারে না, তবে নিয়ন্ত্রণের স্তর ChatGPT চিত্রগুলির প্রথম প্রজন্মের তুলনায় বেশি।

তদুপরি, মডেলটি পূর্ববর্তী পর্যায়ের সবচেয়ে স্বীকৃত বৈশিষ্ট্যগুলির মধ্যে একটিকে হ্রাস করে: সেগুলি অত্যধিক উষ্ণ টোন এবং "হলুদ" চেহারা সহ ছবি যা সহজেই প্রকাশ করে যে এগুলি AI দ্বারা তৈরি করা হয়েছে। স্পষ্টভাবে অনুরোধ না করা হলে, নতুন ডিফল্ট স্টাইলটি একটি প্রাকৃতিক ছবির কাছাকাছি।

ChatGPT-এর মধ্যে ছবির জন্য একটি নিবেদিতপ্রাণ স্থান

ওপেনএআই আপডেট কেবল মডেলকেই প্রভাবিত করে না, বরং ChatGPT ইন্টারফেসে ব্যবহারকারীর অভিজ্ঞতাছবি তৈরি এখন আর কেবল টেক্সট কথোপকথনে এম্বেড করা ফলাফল নয়; এখন এর নিজস্ব একটি নির্দিষ্ট বিভাগ রয়েছে, যা ওয়েবসাইট এবং মোবাইল অ্যাপ উভয়ের সাইডবার থেকে অ্যাক্সেসযোগ্য, যার বৈশিষ্ট্যগুলি রয়েছে ছবি সম্পাদনা এবং সংকুচিত করুন.

  উইন্ডোজ ১১-এ নিরাপত্তা: অ্যান্টিভাইরাস এবং প্রস্তাবিত সরঞ্জাম

এই নতুন স্থানে, যাকে সহজভাবে বলা হয় চিত্রসমস্ত সৃষ্টি এক জায়গায় জড়ো করা হয়। ব্যবহারকারী তাদের ভিজ্যুয়াল ইতিহাস পর্যালোচনা করতে পারেন, নতুন সংস্করণের ভিত্তি হিসেবে পূর্ববর্তী ছবিগুলি পুনঃব্যবহার করতে পারেন এবং একটি সেট অ্যাক্সেস করতে পারেন প্রস্তাবিত ধারণা, শৈলী এবং প্রম্পট যা শুরু থেকে নির্দেশনা না লিখেই শুরু করা সহজ করে তোলে।

ওপেনএআই-এর উদ্দেশ্য হল বিস্তারিত প্রম্পট লেখার সাথে অপরিচিতদের জন্য প্রবেশের বাধা কমানো। এটি যথেষ্ট একটি স্টাইল বেছে নিন, একটি ছবি আপলোড করুন (অথবা একটি সেলফি তুলুন) এবং সিস্টেমকে বিভিন্ন ধরণের বিকল্প প্রস্তাব করতে দিন।এই পদ্ধতিটি পৃথক ব্যবহারকারী এবং সৃজনশীল প্রোফাইল উভয়ের জন্যই ডিজাইন করা হয়েছে যাদের প্রতিটি প্রযুক্তিগত বিবরণ কনফিগার করার সময় নষ্ট না করে দ্রুত পুনরাবৃত্তি করতে হবে।

তদুপরি, এই টুলটি নতুন প্রজন্মের সূচনা করার সুযোগ দেয়। অন্যান্য ছবি প্রক্রিয়াজাতকরণ অব্যাহত থাকাকালীনএটি কর্মপ্রবাহকে আরও সুগম করে, বিশেষ করে যখন প্রচারণা, ওয়েবসাইট বা সোশ্যাল মিডিয়ার জন্য একাধিক সংস্করণ প্রস্তুত করা হয়।

ওপেনএআই জোর দিয়ে বলছে যে এই পুনঃডিজাইনটি অনেক ব্যবহারকারীর মধ্যে পরিলক্ষিত একটি প্যাটার্নের সাথে সাড়া দেয়: জনসাধারণের একটি উল্লেখযোগ্য অংশের জন্য, ChatGPT-এর সাথে প্রথম মিথস্ক্রিয়ার মধ্যে রয়েছে টেক্সটকে একটি ছবিতে রূপান্তর করা।কোম্পানির মতে, পণ্যটিকে একটি নির্দিষ্ট স্থান দেওয়া হল সেই বাস্তব আচরণের সাথে খাপ খাইয়ে নেওয়ার একটি উপায়।

সৃজনশীল এবং পেশাদার ব্যবহার: সোশ্যাল মিডিয়া থেকে ই-কমার্স পর্যন্ত

GPT ইমেজ ১.৫-এর উন্নতিগুলি কেবল তাত্ত্বিক নয়। OpenAI এবং বিভিন্ন প্ল্যাটফর্ম যারা ইতিমধ্যেই মডেলটিকে একীভূত করেছে তারা খুব নির্দিষ্ট ব্যবহারের ক্ষেত্রে হাইলাইট করে যেগুলি এর থেকে উপকৃত হয়। অধিক গতি, নির্ভুল সম্পাদনা, এবং বিস্তারিত তথ্যের আরও ভালো সংরক্ষণ.

সৃজনশীল ক্ষেত্রে, এটি আরও সহজ মানুষ, বস্তু এবং সেটিংসকে একত্রিত করে নতুন দৃশ্যে রূপান্তর করুনএকটি মাত্র ছবি থেকে, বিভিন্ন স্থান, যুগ বা দৃশ্য শৈলীতে সংস্করণ তৈরি করা যেতে পারে: সুসংগত আলো ব্যবহার করে কাউকে বিদেশী শহরে স্থাপন করা থেকে শুরু করে, মুখের সাদৃশ্য বজায় রেখে তাকে ঐতিহাসিক বা সিনেমাটিক নান্দনিক চরিত্রে রূপান্তরিত করা পর্যন্ত।

মার্কেটিং এবং ব্র্যান্ডিং-এ, এই টুলটি সাহায্য করে বিজ্ঞাপন, কভার বা সৃজনশীলতার বৈচিত্র্য তৈরি করুন শুরু থেকে নতুন করে ডিজাইন করার প্রয়োজন ছাড়াই। কর্পোরেট রঙ পরিবর্তন, লোগো যোগ বা স্থানান্তর, টেক্সট সামঞ্জস্য করা, অথবা একই রচনাকে বিভিন্ন ফর্ম্যাটে অভিযোজিত করার মাধ্যমে মূল উপাদানগুলিকে বিকৃত করার ঝুঁকি কম থাকে।

ই-কমার্সের জন্য, GPT ইমেজ 1.5 অনুমতি দেয় RAW ইমেজ এডিটিং সফটওয়্যার ব্যবহার করে সম্পূর্ণ পণ্য ক্যাটালগ তৈরি করুন।আপনি একই জিনিসের বিভিন্ন রঙের বৈচিত্র্য, দৃশ্য এবং কোণ তৈরি করতে পারেন, একই সাথে সমস্ত ছবিতে ভিজ্যুয়াল ধারাবাহিকতা বজায় রাখতে পারেন। Wix, Canva, Figma, Envato এবং অন্যান্য প্ল্যাটফর্মগুলি ইতিমধ্যেই তাদের নিজস্ব পরিষেবাগুলিতে এই ক্ষমতাগুলি ব্যবহার করছে।

  টেলিগ্রাম বট: অফিসিয়াল অ্যাপ দিয়ে আপনার ডেস্কটপ কীভাবে স্বয়ংক্রিয় করবেন

ইউরোপীয় পরিবেশে, যেখানে নকশা, বিজ্ঞাপন এবং ই-কমার্স ক্ষেত্রগুলি বিশেষভাবে প্রতিযোগিতামূলক, এই সমন্বয় গতি, কম API খরচ এবং ব্র্যান্ড ইমেজের উপর নিয়ন্ত্রণ এটি বিশেষ করে SME এবং এজেন্সিগুলির জন্য আকর্ষণীয় হতে পারে যারা তাদের ভিজ্যুয়াল উৎপাদনের কিছু অংশ স্বয়ংক্রিয়ভাবে সম্পন্ন করতে চায়, কোনও পালিশ করা ফিনিশ ছাড়াই।

প্রাপ্যতা, খরচ এবং বর্তমান সীমাবদ্ধতা

OpenAI এর জন্য GPT ইমেজ 1.5 চালু করা শুরু করেছে সকল ChatGPT ব্যবহারকারী, বিনামূল্যে অ্যাকাউন্ট সহএটি ওয়েব সংস্করণ এবং মোবাইল অ্যাপ উভয়ের ক্ষেত্রেই প্রযোজ্য। নতুন ইমেজ স্পেসটি ধীরে ধীরে সক্রিয় করা হবে, যখন ব্যবসা এবং এন্টারপ্রাইজ পরিকল্পনার জন্য ডেডিকেটেড অ্যাক্সেস পরবর্তী পর্যায়ে উপলব্ধ হবে।

API-এর ক্ষেত্রে, মডেলটি এখন স্বাভাবিকভাবে ব্যবহার করা যেতে পারে। কোম্পানিটি ইঙ্গিত দেয় যে ছবির ইনপুট এবং আউটপুট প্রায় ২০% সস্তা। এটি পূর্ববর্তী সংস্করণের তুলনায় আরও শক্তিশালী, যা ডেভেলপার এবং ব্যবসাগুলিকে একই বাজেটে আরও বৈচিত্র্য তৈরি করতে সাহায্য করে। এটি বিশেষ করে সেইসব প্রকল্পের জন্য প্রাসঙ্গিক যেখানে বিজ্ঞাপন প্ল্যাটফর্ম বা স্বয়ংক্রিয় ক্যাটালগের মতো স্কেলে ছবি তৈরি করতে হয়।

অগ্রগতি সত্ত্বেও, OpenAI স্বীকার করে যে সীমাবদ্ধতা এখনও বিদ্যমানকিছু খুব নির্দিষ্ট শৈল্পিক শৈলী - উদাহরণস্বরূপ, নির্দিষ্ট ধরণের অ্যানিমে - পূর্ববর্তী মডেলগুলির তুলনায় কম বিশ্বাসযোগ্য ফলাফল দেয় এবং অনেক লোকের সাথে ছবি সম্পাদনা করা এখনও একটি চ্যালেঞ্জ, মুখ বা ভঙ্গিতে সম্ভাব্য অসঙ্গতি সহ।

এই সমস্যাগুলির কিছু প্রশমনের জন্য, কোম্পানিটি এর সুবিধা গ্রহণের পরামর্শ দিচ্ছে ফিল্টার এবং পূর্বনির্ধারিত শৈলী নতুন ইমেজেস অভিজ্ঞতার অন্তর্ভুক্ত, এগুলি আরও স্থিতিশীল সূচনা বিন্দু হিসেবে কাজ করে। উপরন্তু, জেনারেটরের পূর্ববর্তী সংস্করণটি ChatGPT-তে উপলব্ধ থাকে, যা ব্যবহারকারীদের তাদের স্টাইলের সাথে আরও উপযুক্ত মনে হলে এটিতে ফিরে যেতে দেয়।

ওপেনএআই এই রিলিজটি মাল্টিমোডাল অভিজ্ঞতার দিকে একটি বৃহত্তর কৌশলের মধ্যবর্তী পদক্ষেপ হিসেবে উপস্থাপন করে, যেখানে টেক্সট, ছবি এবং অন্যান্য ফর্ম্যাট একই পরিবেশে সহাবস্থান করে। পেশাদার এবং দৈনন্দিন ব্যবহারে GPT ইমেজ 1.5 এর গ্রহণযোগ্যতা এর সম্ভাবনার পরিধি নির্ধারণ করবে। AI দিয়ে ছবি তৈরি এবং সম্পাদনা করা দৈনন্দিন কাজের হাতিয়ারে পরিণত হচ্ছে এবং শুধুমাত্র একটি ট্রেন্ডি প্রযুক্তিগত কৌতূহলের মধ্যে নয়।

এই আপডেটের মাধ্যমে, ChatGPT Images একটি হিসাবে তার অবস্থানকে আরও দৃঢ় করে তোলে সমন্বিত ভিজ্যুয়াল স্টাডি চ্যাটেই: দ্রুততর, পরিবর্তনের উপর অধিক নিয়ন্ত্রণ সহ এবং ডিজাইন, মার্কেটিং বা ই-কমার্স কর্মপ্রবাহে একীভূত হওয়ার জন্য প্রস্তুত, স্পেন এবং বাকি ইউরোপ উভয় ক্ষেত্রেই, যেখানে আকর্ষণীয় এবং সামঞ্জস্যপূর্ণ ভিজ্যুয়াল কন্টেন্ট অফার করার প্রতিযোগিতা তীব্রতর হচ্ছে।