ঢাকা ০৬:০৬ পূর্বাহ্ন, সোমবার, ১২ জানুয়ারী ২০২৬

২০২৫ সালে নতুন মাত্রায় ডিপফেক, আগামী দিনে কী অপেক্ষা করছে

২০২৫ সালে ডিপফেক প্রযুক্তি অভাবনীয় গতিতে উন্নত হয়েছে। কৃত্রিম বুদ্ধিমত্তা (এআই) দিয়ে তৈরি মুখ, কণ্ঠস্বর ও পুরো শরীরের অভিনয় এখন এতটাই বাস্তবসম্মত যে কয়েক বছর আগেও বিশেষজ্ঞরা এমন অগ্রগতির কথা কল্পনা করেননি। একই সঙ্গে এই প্রযুক্তি ব্যবহার করে মানুষকে বিভ্রান্ত ও প্রতারিত করার ঘটনাও উল্লেখযোগ্যভাবে বেড়েছে।

বিশেষ করে কম রেজল্যুশনের ভিডিও কল কিংবা সামাজিক যোগাযোগমাধ্যমে ছড়িয়ে পড়া ভিডিওর ক্ষেত্রে ডিপফেক এখন সাধারণ মানুষের চোখে প্রায় নিখুঁত। বাস্তবতা এমন পর্যায়ে পৌঁছেছে যে অনেক সময় সাধারণ দর্শক তো বটেই, এমনকি বিভিন্ন প্রতিষ্ঠানও আসল ও কৃত্রিম ভিডিও আলাদা করতে পারছে না।

শুধু মান নয়, সংখ্যার দিক থেকেও ডিপফেকের বিস্তার বহুদূর এগিয়েছে। সাইবার নিরাপত্তা প্রতিষ্ঠান ডিপস্ট্রাইকের হিসাবে, ২০২৩ সালে অনলাইনে ডিপফেকের সংখ্যা ছিল আনুমানিক পাঁচ লাখ। ২০২৫ সালে তা বেড়ে দাঁড়িয়েছে প্রায় ৮০ লাখে, যার বার্ষিক প্রবৃদ্ধি প্রায় ৯০০ শতাংশ।

এ বিষয়ে গবেষণা করা কম্পিউটার বিজ্ঞানী ও ইউনিভার্সিটি অ্যাট বাফালোর অধ্যাপক সিওয়েই লিউ মনে করছেন, ২০২৬ সালে পরিস্থিতি আরও জটিল হবে। কারণ ডিপফেক তখন রিয়েল-টাইমে প্রতিক্রিয়াশীল ‘সিনথেটিক পারফরমার’-এ রূপ নেবে।

যেকোনও মানুষই এখন ডিপফেক বানাতে পারে

ডিপফেকের এই দ্রুত উন্নতির পেছনে কয়েকটি বড় প্রযুক্তিগত পরিবর্তন কাজ করছে।

প্রথমত, ভিডিও জেনারেশন মডেলে এসেছে বড় অগ্রগতি। নতুন মডেলগুলো সময়ের ধারাবাহিকতা বজায় রেখে ভিডিও তৈরি করতে পারে—যেখানে মুখভঙ্গি, শরীরের নড়াচড়া ও পরিচয় এক ফ্রেম থেকে আরেক ফ্রেমে একই রকম থাকে।

এর ফলে চোখ বা চোয়ালের আশপাশে ঝাঁকুনি, বিকৃতি কিংবা ফ্লিকার—যা আগে ডিপফেক শনাক্ত করার সহজ উপায় ছিল। সেগুলো প্রায় সম্পূর্ণভাবে হারিয়ে গেছে।

দ্বিতীয়ত, ভয়েস ক্লোনিং প্রযুক্তি এমন এক পর্যায়ে পৌঁছেছে, যাকে অধ্যাপক লিউ ‘অচেনা করা অসম্ভব সীমা’ বলে উল্লেখ করেছেন। মাত্র কয়েক সেকেন্ডের অডিও থেকেই এখন মানুষের স্বাভাবিক উচ্চারণ, আবেগ, বিরতি এমনকি শ্বাস নেওয়ার শব্দসহ নিখুঁত কণ্ঠস্বর নকল করা সম্ভব। এই প্রযুক্তি ইতোমধ্যে বড় আকারের প্রতারণার হাতিয়ার হয়ে উঠেছে। কিছু বড় খুচরা বিক্রেতা প্রতিদিন এক হাজারের বেশি এআই-সৃষ্ট প্রতারণামূলক কল পাচ্ছে বলে জানিয়েছে।

তৃতীয়ত, ভোক্তাপর্যায়ের টুলগুলো প্রযুক্তিগত বাধা প্রায় শূন্যে নামিয়ে এনেছে। ওপেনএআইয়ের ‘সোরা ২’, গুগলের ‘ভিও ৩’ এবং অসংখ্য স্টার্টআপের নতুন টুলের মাধ্যমে এখন যে কেউ শুধু একটি ধারণা লিখে, এআই দিয়ে স্ক্রিপ্ট বানিয়ে কয়েক মিনিটেই পেশাদার মানের অডিও-ভিডিও তৈরি করতে পারে। এআই এজেন্ট পুরো প্রক্রিয়াটিই স্বয়ংক্রিয়ভাবে সম্পন্ন করছে।

বাস্তব সময়ের দিকে ডিপফেকের যাত্রা

বিশেষজ্ঞদের মতে, ২০২৬ সালের সবচেয়ে বড় পরিবর্তন হবে রিয়েল-টাইম ডিপফেক। অর্থাৎ আগেভাগে বানানো ভিডিও নয়, বরং সরাসরি লাইভ বা প্রায় লাইভ ভিডিও তৈরি করা সম্ভব হবে, যা মানুষের আচরণ ও প্রতিক্রিয়ার সঙ্গে সঙ্গে বদলাবে।

পরিচয় মডেলিং এখন এমন পর্যায়ে যাচ্ছে, যেখানে শুধু চেহারা নয়—চলাফেরা, কথা বলার ধরন ও আচরণও একসঙ্গে নকল করা যাবে। ফলে ভবিষ্যতে ভিডিও কলে সম্পূর্ণ কৃত্রিম অংশগ্রহণকারী দেখা যেতে পারে, কিংবা প্রতারকরা ব্যবহার করতে পারে প্রতিক্রিয়াশীল এআই অবতার।

শনাক্তকরণে নতুন চ্যালেঞ্জ

এই পরিস্থিতিতে শুধু চোখে দেখে বা পিক্সেল বিশ্লেষণ করে ডিপফেক শনাক্ত করা আর যথেষ্ট হবে না বলে মনে করছেন গবেষকরা। ভবিষ্যতের প্রতিরক্ষা নির্ভর করবে অবকাঠামোগত সুরক্ষার ওপর—যেমন ক্রিপ্টোগ্রাফিকভাবে সাইন করা মিডিয়া, কনটেন্টের উৎস যাচাইয়ের আন্তর্জাতিক মানদণ্ড এবং মাল্টিমোডাল ফরেনসিক টুল।

অধ্যাপক লিউয়ে বলেন, ‘পিক্সেলের দিকে আরও মনোযোগ দিয়ে তাকানোই আর সমাধান নয়।’

সূত্র: দ্য কনভারসেশন

ট্যাগস :
আপলোডকারীর তথ্য

জনপ্রিয় সংবাদ

বিপিএল মহারণ: আজ সিলেট-রংপুর, ঢাকা-রাজশাহী; টিভিতে কখন দেখবেন?

২০২৫ সালে নতুন মাত্রায় ডিপফেক, আগামী দিনে কী অপেক্ষা করছে

আপডেট সময় : ০৯:২৪:১৫ অপরাহ্ন, রবিবার, ২৮ ডিসেম্বর ২০২৫

২০২৫ সালে ডিপফেক প্রযুক্তি অভাবনীয় গতিতে উন্নত হয়েছে। কৃত্রিম বুদ্ধিমত্তা (এআই) দিয়ে তৈরি মুখ, কণ্ঠস্বর ও পুরো শরীরের অভিনয় এখন এতটাই বাস্তবসম্মত যে কয়েক বছর আগেও বিশেষজ্ঞরা এমন অগ্রগতির কথা কল্পনা করেননি। একই সঙ্গে এই প্রযুক্তি ব্যবহার করে মানুষকে বিভ্রান্ত ও প্রতারিত করার ঘটনাও উল্লেখযোগ্যভাবে বেড়েছে।

বিশেষ করে কম রেজল্যুশনের ভিডিও কল কিংবা সামাজিক যোগাযোগমাধ্যমে ছড়িয়ে পড়া ভিডিওর ক্ষেত্রে ডিপফেক এখন সাধারণ মানুষের চোখে প্রায় নিখুঁত। বাস্তবতা এমন পর্যায়ে পৌঁছেছে যে অনেক সময় সাধারণ দর্শক তো বটেই, এমনকি বিভিন্ন প্রতিষ্ঠানও আসল ও কৃত্রিম ভিডিও আলাদা করতে পারছে না।

শুধু মান নয়, সংখ্যার দিক থেকেও ডিপফেকের বিস্তার বহুদূর এগিয়েছে। সাইবার নিরাপত্তা প্রতিষ্ঠান ডিপস্ট্রাইকের হিসাবে, ২০২৩ সালে অনলাইনে ডিপফেকের সংখ্যা ছিল আনুমানিক পাঁচ লাখ। ২০২৫ সালে তা বেড়ে দাঁড়িয়েছে প্রায় ৮০ লাখে, যার বার্ষিক প্রবৃদ্ধি প্রায় ৯০০ শতাংশ।

এ বিষয়ে গবেষণা করা কম্পিউটার বিজ্ঞানী ও ইউনিভার্সিটি অ্যাট বাফালোর অধ্যাপক সিওয়েই লিউ মনে করছেন, ২০২৬ সালে পরিস্থিতি আরও জটিল হবে। কারণ ডিপফেক তখন রিয়েল-টাইমে প্রতিক্রিয়াশীল ‘সিনথেটিক পারফরমার’-এ রূপ নেবে।

যেকোনও মানুষই এখন ডিপফেক বানাতে পারে

ডিপফেকের এই দ্রুত উন্নতির পেছনে কয়েকটি বড় প্রযুক্তিগত পরিবর্তন কাজ করছে।

প্রথমত, ভিডিও জেনারেশন মডেলে এসেছে বড় অগ্রগতি। নতুন মডেলগুলো সময়ের ধারাবাহিকতা বজায় রেখে ভিডিও তৈরি করতে পারে—যেখানে মুখভঙ্গি, শরীরের নড়াচড়া ও পরিচয় এক ফ্রেম থেকে আরেক ফ্রেমে একই রকম থাকে।

এর ফলে চোখ বা চোয়ালের আশপাশে ঝাঁকুনি, বিকৃতি কিংবা ফ্লিকার—যা আগে ডিপফেক শনাক্ত করার সহজ উপায় ছিল। সেগুলো প্রায় সম্পূর্ণভাবে হারিয়ে গেছে।

দ্বিতীয়ত, ভয়েস ক্লোনিং প্রযুক্তি এমন এক পর্যায়ে পৌঁছেছে, যাকে অধ্যাপক লিউ ‘অচেনা করা অসম্ভব সীমা’ বলে উল্লেখ করেছেন। মাত্র কয়েক সেকেন্ডের অডিও থেকেই এখন মানুষের স্বাভাবিক উচ্চারণ, আবেগ, বিরতি এমনকি শ্বাস নেওয়ার শব্দসহ নিখুঁত কণ্ঠস্বর নকল করা সম্ভব। এই প্রযুক্তি ইতোমধ্যে বড় আকারের প্রতারণার হাতিয়ার হয়ে উঠেছে। কিছু বড় খুচরা বিক্রেতা প্রতিদিন এক হাজারের বেশি এআই-সৃষ্ট প্রতারণামূলক কল পাচ্ছে বলে জানিয়েছে।

তৃতীয়ত, ভোক্তাপর্যায়ের টুলগুলো প্রযুক্তিগত বাধা প্রায় শূন্যে নামিয়ে এনেছে। ওপেনএআইয়ের ‘সোরা ২’, গুগলের ‘ভিও ৩’ এবং অসংখ্য স্টার্টআপের নতুন টুলের মাধ্যমে এখন যে কেউ শুধু একটি ধারণা লিখে, এআই দিয়ে স্ক্রিপ্ট বানিয়ে কয়েক মিনিটেই পেশাদার মানের অডিও-ভিডিও তৈরি করতে পারে। এআই এজেন্ট পুরো প্রক্রিয়াটিই স্বয়ংক্রিয়ভাবে সম্পন্ন করছে।

বাস্তব সময়ের দিকে ডিপফেকের যাত্রা

বিশেষজ্ঞদের মতে, ২০২৬ সালের সবচেয়ে বড় পরিবর্তন হবে রিয়েল-টাইম ডিপফেক। অর্থাৎ আগেভাগে বানানো ভিডিও নয়, বরং সরাসরি লাইভ বা প্রায় লাইভ ভিডিও তৈরি করা সম্ভব হবে, যা মানুষের আচরণ ও প্রতিক্রিয়ার সঙ্গে সঙ্গে বদলাবে।

পরিচয় মডেলিং এখন এমন পর্যায়ে যাচ্ছে, যেখানে শুধু চেহারা নয়—চলাফেরা, কথা বলার ধরন ও আচরণও একসঙ্গে নকল করা যাবে। ফলে ভবিষ্যতে ভিডিও কলে সম্পূর্ণ কৃত্রিম অংশগ্রহণকারী দেখা যেতে পারে, কিংবা প্রতারকরা ব্যবহার করতে পারে প্রতিক্রিয়াশীল এআই অবতার।

শনাক্তকরণে নতুন চ্যালেঞ্জ

এই পরিস্থিতিতে শুধু চোখে দেখে বা পিক্সেল বিশ্লেষণ করে ডিপফেক শনাক্ত করা আর যথেষ্ট হবে না বলে মনে করছেন গবেষকরা। ভবিষ্যতের প্রতিরক্ষা নির্ভর করবে অবকাঠামোগত সুরক্ষার ওপর—যেমন ক্রিপ্টোগ্রাফিকভাবে সাইন করা মিডিয়া, কনটেন্টের উৎস যাচাইয়ের আন্তর্জাতিক মানদণ্ড এবং মাল্টিমোডাল ফরেনসিক টুল।

অধ্যাপক লিউয়ে বলেন, ‘পিক্সেলের দিকে আরও মনোযোগ দিয়ে তাকানোই আর সমাধান নয়।’

সূত্র: দ্য কনভারসেশন