বৃহস্পতিবার, ২৫ এপ্রিল ২০২৪, ০৭:৪৪ অপরাহ্ন
Uncategorized

ভয়েস ক্লোনিং: কৃত্রিম বুদ্ধিমত্তায় কণ্ঠস্বর হুবহু নকলের প্রযুক্তি, অপরাধীদের পোয়াবারো?

  • আপডেট সময় মঙ্গলবার, ১৩ জুলাই, ২০২১

বিজ্ঞান ও প্রযুক্তি যতই উন্নত হচ্ছে ততই নানা পেশা ও নানা কাজ যন্ত্র নির্ভর করে তোলার দৌড় বাড়ছে। এর মধ্যে জনপ্রিয় আর সফল হয়ে উঠেছে কণ্ঠস্বর হুবহু নকল করার প্রযুক্তি, যাতে আকৃষ্ট হচ্ছেন ভয়েস আর্টিস্টরা। কিন্তু কেন এই প্রযুক্তির উদ্ভাবন, অভিনেতা বা ভয়েস আর্টিস্টদের জন্য এটা কী সুসংবাদ না দুঃসংবাদ আর সাইবার অপরাধীদের জন্যই বা এটা কত বড় সুযোগ- এসবই ব্যাখ্যা করেছেন বিবিসির বাণিজ্য বিষয়ক সংবাদদাতা কিট্টি পালমাই।

অ্যামেরিকার টেক্সাসে ভয়েস আর্টিস্ট এবং অভিনেতা হিসাবে কাজ করেন টিম হেলার।

তিনি যখন তার কণ্ঠস্বরের নকল বা ক্লোন প্রথম শোনেন তিনি বলেন তা এতটাই সঠিক ছিল যে বিস্ময়ে “আমার চোয়াল মাটিতে গিয়ে ঠেকেছিল…অবিশ্বাস্যরকম মিল দেখে আমার মাথা ঘুরে গিয়েছিল”।

কীভাবে করা হয় ভয়েস ক্লোনিং?

কারো কণ্ঠ ক্লোন বা হুবহু নকল করা হয় কম্পিউটারে কৃত্রিম বুদ্ধিমত্তার একটি সফটওয়্যার প্রোগ্রাম ব্যবহার করে, যার মাধ্যমে একজন ব্যক্তির কণ্ঠস্বর হুবহু নকল করে একটা কৃত্রিম কণ্ঠস্বর তৈরি করা হয়।

এর জন্য কাউকে মাত্র কয়েক মিনিট তার কণ্ঠের রেকর্ডিং করে দিতে হয়। এর থেকেই সফটওয়্যার জেনে যায় তার কণ্ঠের আওয়াজ, তার বাচনভঙ্গি- কীভাবে ওই ব্যক্তি কথা বলেন।

অ্যামেরিকার টেক্সাসে ভয়েস আর্টিস্ট এবং অভিনেতা হিসাবে কাজ করেন টিম হেলার। তিনি

ছবির উৎস,TIM HELLER

ছবির ক্যাপশান,
আমেরিকার ভয়েস আর্টিস্ট টিম হেলার যখন তার কণ্ঠস্বরের নকল প্রথম শোনেন তিনি বলেন তা এতটাই সঠিক ছিল যে বিস্ময়ে তিনি হতবাক হয়ে গিয়েছিলেন

শুধু আপনার কণ্ঠের আওয়াজই নয়, এই প্রযুক্তি সাম্প্রতিক সময়ে এতটাই এগিয়েছে যে আপনি শুনলে টের পাবেন না যে আপনার কণ্ঠের যান্ত্রিক অনুকরণ আপনি শুনছেন।

আপনার কথা বলার ঢং, আপনার অ্যাকসেন্ট বা কথার উচ্চারণভঙ্গি, আপনি কত দ্রুত বা ধীরে কথা বলেন, কথা বলার সময় আপনার কণ্ঠ কতটা ওঠে বা নামে, শব্দের মাঝে আপনি যেভাবে শ্বাস নেন এবং গলার স্বর আপনার কতটা হালকা বা গম্ভীর সবই এই সফটওয়্যার হুবহু নকল করে ফেলে।

এই সফটওয়্যারের চমকে দেবার মত আরও ক্ষমতা আছে।

আপনার কণ্ঠস্বরের সব বিশেষত্ব জেনে নেয়ার পর আপনি যখন কম্পিউটারের কীবোর্ডে কোন শব্দ বা বাক্য লিখবেন, সেটা কম্পিউটার হুবহু আপনার গলার আওয়াজে উপস্থাপন করবে – অর্থাৎ শুনলে মনে হবে আপনিই সরাসরি কথা বলছেন।

শুধু তাই নয়, আপনার নকল কণ্ঠস্বরে দরকার হলে নানা ধরনের আবেগও ফুটিয়ে তুলতে পারবে এই সফটওয়্যার- যেমন রাগ, ভয়, আনন্দ, প্রেম, বিরহ বা বিরক্তি।

নকল কন্ঠস্বর তৈরির এই ব্যবসা এখন বেশ রমরমা হয়ে উঠছে। এরকম একটি প্রতিষ্ঠানের নাম ভোকালআইডি- তাদের কোম্পানি অ্যামেরিকার বোস্টন শহরে।

রুপাল প্যাটেল আমেরিকার একজন ভয়েস ক্লোনিং বিশেষজ্ঞ

ছবির উৎস,RUPAL PATEL

ছবির ক্যাপশান,
রুপাল প্যাটেল আমেরিকার একজন ভয়েস ক্লোনিং বিশেষজ্ঞ

কেন এই প্রযুক্তির উদ্ভাবন?

ভোকালআইডি প্রতিষ্ঠানটি তৈরি করেছেন রুপাল প্যাটেল। তিনি সংস্থাটির প্রধান নির্বাহী। তিনি নর্থইস্টার্ন ইউনিভার্সিটির যোগাযোগ বিজ্ঞান ও এ সংক্রান্ত সমস্যা বিষয়ে অধ্যাপক।

রুপাল প্যাটেল এই ব্যবসা গড়ে তোলেন ২০১৪ সালে তার চিকিৎসা কাজকে আরও এগিয়ে নেবার লক্ষ্যে। যেসব রোগী অসুস্থতার কারণে বা অস্ত্রোপচারের পর কথা বলার ক্ষমতা হারিয়েছে তাদের কণ্ঠস্বর যন্ত্রের সাহায্যে কৃত্রিমভাবে তৈরি করার তাগিদ থেকে এই প্রযুক্তির ওপর ভিত্তি করে তিনি তার সংস্থাটি প্রতিষ্ঠা করেন।

তিনি বলছেন এই প্রযুক্তি কাজ করে কৃত্রিম বুদ্ধিমত্তা বা আর্টিফিশিয়াল ইন্টালিজেন্স (এআই) সফটওয়্যার ব্যবহার করে। কী প্রয়োজন সেটা “বুঝতে পারার” ক্ষমতা এআই-এর আছে, এবং সেটা বুঝে এআই নিজেই ঠিক করে নেয় তার কাছে কী চাওয়া হচ্ছে।

অধ্যাপক প্যাটেল বলছেন, গত কয়েক বছরে এই প্রযুক্তি অনেক উন্নত হয়েছে এবং মানুষের কণ্ঠস্বর হুবহু নকল করতে পারছে।

তিনি বলছেন এখন শুধু কণ্ঠস্বর হারানো রোগী নয়, তার খদ্দেরদের মধ্যে রয়েছেন ভয়েসওভার শিল্পীরা।

ভয়েস আর্টিস্টদের জন্য নতুন জগত

টেক্সাসের ভয়েসওভার আর্টিস্ট ও অভিনেতা মি. হেলার কার্টুন চরিত্রে কণ্ঠ দেন, অডিও বই এবং তথ্যচিত্রে কণ্ঠ দেন, ভিডিও গেমে শোনা যায় তার কথা, বিভিন্ন সিনেমার ট্রেলরেও তিনি ভয়েসওভার করেন।

ভয়েস আর্টিস্ট টিম হেলার

ছবির উৎস,TIM HELLER

ছবির ক্যাপশান,
কৃত্রিম বুদ্ধিমত্তা দিয়ে কণ্ঠস্বর নকল করার প্রযুক্তি নিয়ে রীতিমত উৎসাহী ভয়েস আর্টিস্ট টিম হেলার

মি. হেলার সম্প্রতি অধ্যাপক প্যাটেলের কোম্পানিতে গিয়ে তার কণ্ঠের নকল তৈরি করে এসেছেন, আর তা এতটাই নিখুঁত যে তিনি রীতিমত মুগ্ধ। তিনি বলছেন, এই প্রযুক্তি তাকে আরও বেশি কাজ পেতে সাহায্য করবে।

“একটা কাজ হাতে নিয়ে যদি আমি ব্যস্ত থাকি, তখন আরেকটা কাজের অফার এলে সেটা হাতছাড়া হবার ভয় করতে হবে না। আমার ‘নকল’ কণ্ঠটা তাদের কাছে পাঠিয়ে দেব। সেটা ব্যবহার করে ওরা কাজটা করে নিতে পারবে। তাতে ওদেরও সময় বাঁচবে, আমারও পরিশ্রম কমবে। আর সবচেয়ে বড় কথা হল, কাজটাও আমার হাতেই থাকবে,” বলছেন মি. হেলার।

তিনি বলছেন তার নকল কণ্ঠ তিনি এখনও কাউকে বিক্রি করেননি। তবে তা কিনতে আগ্রহ দেখিয়েছে বেশ কিছু কোম্পানি।

কৃত্রিম বুদ্ধিমত্তা কতটা চালাক?

অধ্যাপক প্যাটেল বলছেন, কৃত্রিম বুদ্ধিমত্তা ভিত্তিক সফটওয়্যার দারুণ বুদ্ধিমান।

“আমরা নানা অ্যাকসন্টের কণ্ঠ তৈরি করতে পারি এর মাধ্যমে। ট্রান্সজেণ্ডারদের কণ্ঠও আমরা তৈরি করেছি- যেখানে কণ্ঠটা পুরুষের নাকি নারীর তা বোঝা যাবে না।”

তিনি বলছেন: “আমাদের প্রত্যেকের উচ্চারণের আলাদা ঢং আছে, কথা বলার ঢং আমাদের সবার আলাদা, গলার স্বর আমাদের আলাদা। এই প্রযুক্তি সব রকমের ঢং আয়ত্ত করে নিতে পারে।”

জোহাইব আহমেদ

ছবির উৎস,ZOHAIB AHMED

ছবির ক্যাপশান,
জোহাইব আহমেদ তার সংস্থায় নকল করা কণ্ঠের ইংরেজি কথা ১৫টি ভাষায় রূপান্তর করতে পারেন

ভয়েস ক্লোনিং ব্যবহার করে তৈরি কারোর বক্তব্যকে বিভিন্ন ভাষাতেও অনুবাদ করা সম্ভব। যেটা চলচ্চিত্র শিল্পের জন্যও দারুণ সুখবর।

“ধরুন আমেরিকার চিত্র নির্মাতাদের ছবি বিদেশী বাজারগুলোর জন্য অন্য ভাষায় ‘ডাব’ করানোর জন্য অর্থ দিয়ে আর সেই ভাষার অভিনেতাদের ভাড়া করতে হবে না। কাজটা করবে কৃত্রিম বুদ্ধিমত্তার এই সফটওয়্যার,” বলছেন অধ্যাপক প্যাটেল।

ক্যানাডার এধরনের একটি প্রতিষ্ঠান রিসেম্বল এআই বলছে – তারা ইংরেজিতে ক্লোন করা কণ্ঠ এই মুহূর্তে ১৫টি বিভিন্ন ভাষায় রূপান্তর করতে পারে।

সংস্থাটির প্রধান নির্বাহী জোহাইব আহমেদ বলছেন, কেউ মাত্র দশ মিনিট তার কথা রেকর্ড করে দিলেই তার কোম্পানি তার কণ্ঠের উঁচু মানের নকল তৈরি করে দিতে পারে।

“এআই যখন আপনার কণ্ঠ শুনবে, সে আপনার কণ্ঠের অনেক খুঁটিনাটি বিষয় ধরে ফেলতে পারবে- আপনার গলার পর্দা, স্বরের তীব্রতা, কণ্ঠের গভীরতাসহ অনেক কিছু। একজন মানুষের গলার স্বরে হাজারো জিনিস আছে, যা আপনার আমার মত সাধারণ মানুষের কানে ধরাও পড়ে না।”

ভয়েস ক্লোনিং-এর বিপদ কোথায়?

এত উচ্চ প্রযুক্তির ভয়েস ক্লোনিং-এর বাণিজ্যিক সুবিধার দিক যেমন আছে, তেমনি এর গুরুতর ঝুঁকির দিকও রয়েছে।

বিশেষজ্ঞরা খুবই উদ্বিগ্ন যে এই প্রযুক্তি সাইবার অপরাধের জন্য খুবই ঊর্বর একটা ক্ষেত্র। কারণ ধরুন যে আপনার সাথে কথা বলছে সে আসল মানুষ নাকি নকল মানুষ তা বোঝা এর ফলে অসম্ভব হয়ে দাঁড়াবে, এবং আপনাকে ফাঁদে ফেলা অপরাধীদের জন্য খুবই সহজ হবে।

ডিজিটাল প্রযুক্তি ব্যবহার করে যেসব ভুয়া ভিডিও তৈরি করা হয়, সেগুলোর মত এভাবে হুবহু নকল করা কণ্ঠকেও “ডিপফেক” বলা হয়।

কম্পিউটারে রেকর্ড করা কণ্ঠ

ছবির উৎস,GETTY IMAGES

ছবির ক্যাপশান,
একজন ব্যক্তির কণ্ঠস্বর কম্পিউটারের মাধ্যমে হুবহু নকল বা ক্লোন করার প্রযুক্তি এখন রীতিমত বাস্তব সম্ভাবনা হয়ে উঠেছে

সাইবার নিরাপত্তা বিশেষজ্ঞ এডি ববরিটস্কি বলছেন এধরনের কৃত্রিম কণ্ঠ ব্যবহারের “ব্যাপক নিরাপত্তা ঝুঁকি” রয়েছে।

“ইমেল এবং টেক্সট মেসেজের ক্ষেত্রে আমরা এখন বহু বছর ধরেই জানি যে অন্যের ইমেল পরিচয় নকল করে বা অন্যের ফোন নম্বর ব্যবহার করে অপরাধীরা ভুয়া ইমেল বা টেক্সট পাঠিয়ে থাকে,” – বলছেন এই বিশেষজ্ঞ।

“কিন্তু এতদিন পর্যন্ত যখন আমরা ফোনে কারোর সাথে কথা বলতাম, আমরা অন্তত এটুকু নিশ্চিন্ত থাকতে পারতাম যে যার সাথে কথা বলছি সে আমার পরিচিত কণ্ঠ- তাকে অন্তত বিশ্বাস করা যায়।”

মি. ববরিটস্কি বলছেন সেটাও এখন বদলে যাচ্ছে। “ধরুন, কোন সংস্থার বস তার কর্মচারীকে ফোন করে বললেন আমার কিছু তথ্য দরকার। সেসব স্পর্শকাতর, গোপন তথ্য। কিন্তু কর্মচারী ভাবলেন আমি তো বসের কণ্ঠ চিনি। কাজেই দ্বিধা না করে বসের নির্দেশ মেনে তিনি সেসব তথ্য দিয়ে দিলেন। সাইবার অপরাধীদের জন্য এ তো সুবর্ণ সুযোগ।”

আসলেই ২০১৯ সালে ওয়াল স্ট্রিট জার্নালে এরকম একটি ঘটনার খবর ছাপা হয়েছিল। ব্রিটেনের একটি প্রতিষ্ঠানের ম্যানেজার জার্মানি থেকে তার বসের কণ্ঠের একটি নির্দেশ পেয়ে দু লাখ বিশ হাজার ইউরো (দু লাখ ৬০ হাজার ডলার) অর্থ পাঠিয়েছিল যার কাছে, সে ছিল প্রতারক। জার্মান কোম্পানির বসের ক্লোন করা কণ্ঠ ব্যবহার করেছিল ঐ প্রতারক।

“এধরনের নতুন প্রযুক্তি এবং তার সাথে সংশ্লিষ্ট নিরাপত্তা হুমকি মোকাবেলার জন্য এখন প্রস্তুতি নেয়া প্রয়োজন,” বলছেন মি. ববরিটস্কি।

অপরাধীদের মোকাবেলার পথ কি?

এধরনের নতুন অপরাধ মোকাবেলার জন্যও বিশ্বের বিভিন্ন দেশে প্রযুক্তি কোম্পানিগুলো কাজ শুরু করে দিয়েছে বলে জানাচ্ছে কৃত্রিম বুদ্ধিমত্তা বিষয়ে বিশেষজ্ঞ ওয়েবসাইট ভেনচার বিট।

এই কোম্পানিগুলো এমন প্রযুক্তি তৈরি করছে যা দিয়ে কোন অডিও ভুয়া কিনা তা পরীক্ষা করা যাবে। কোন কথা অস্বাভাবিকভাবে একাধিকবার ব্যবহার করা হয়েছে কিনা, কিংবা কণ্ঠের পেছনে এমনকি হালকা ডিজিটার শব্দ আছে কিনা, এছাড়াও কিছু শব্দ বা বাক্যের গঠন এসব পরীক্ষা করার ব্যবস্থা দিয়ে এই পাল্টা প্রযুক্তি গড়ে তোলা হচ্ছে।

সরকার এবং আইনশৃঙ্খলা রক্ষাকারী সংস্থাগুলোও নতুন এই অপরাধ জগত সম্পর্কে সজাগ হয়ে উঠছে।

গত বছর ইউরোপিয় ইউনিয়নের আইন রক্ষাকারী সংস্থা ইউরোপোল ইইউর সদস্য দেশগুলোকে ‘ডিপফেক’ প্রযুক্তি ধরার জন্য প্রযুক্তি খাতে “বড়ধরনের বিনিয়োগের” আহ্বান জানিয়েছে।

ভিডিওর ক্যাপশান,‘ডিপফেক’ ভিডিওতে আপনাকে এমন কিছু করতে বা বলতে দেখা যাবে, যা আপনি কখনোই করেননি বা বলেননি

‘ঠকানো’র ঝুঁকি কতটা?

কিন্তু মি. হেলারের মত যারা মনে করছেন একবার কণ্ঠের ক্লোন তৈরি করে ফেলতে পারলে সব কাজ তার হাতের মুঠোয় থাকবে, সেটা কতটা বাস্তব, কতটা অলীক?

হুবহু নকল কণ্ঠের একটা ভাণ্ডার তৈরি হলে, তারও কি কাজ হারানোর আশংকা বাড়বে না? যেখানে কৃত্রিম বুদ্ধিমত্তা এতটাই বুদ্ধিমান যে একটা কণ্ঠকে সে সফটওয়ারের মাধ্যমে বদলে দিতে পারবে?

“মানুষের আসল কণ্ঠস্বরের কদর হারাবে না বলেই আমি বিশ্বাস করি। যারা আমাকে কাজ দিতেন তারা আমাকে সশরীরে বিভিন্ন অনুষ্ঠানে কণ্ঠ দিতে ডাকবেন বলে আমার আশা,” বলছেন ভয়েস শিল্পী টিম হেলার।

তবে আমেরিকায় অভিনেতাদের ইউনিয়ন স্ক্রিন অ্যাক্টরস গিল্ড-এর নির্বাহী ভাইস প্রেসিডেন্ট রেবেকা ডেমন বলছেন, এই প্রযুক্তি ব্যবহারের অন্য একটা উদ্বেগের দিকও আছে। সেটা হল ভয়েসওভার শিল্পীদের ঠকানোর সম্ভাব্য প্রবণতা।

“ভয়েস ক্লোনিং, ভয়েস আর্টিস্ট শিল্পীদের জন্য একটা নতুন সম্ভাবনার দরজা অবশ্যই খুলে দিতে পারে। কিন্তু তাদের নকল করে রাখা কণ্ঠ কখন কোন কাজে ব্যবহার করা হচ্ছে, অনুমতি নিয়ে তা করা হচ্ছে কিনা, যে কাজে তাদের কণ্ঠ ব্যবহার করা হচ্ছে তার জন্য সঠিক ফি তাদের দেয়া হচ্ছে কিনা, এসবের তত্ত্বাবধানও কিন্তু খুবই গুরুত্বপূর্ণ,” তিনি বলেন।

কেউ যখন তার নকল কণ্ঠ বিক্রি করে দিচ্ছে তখন সেই বিক্রির জন্য সঠিক চুক্তি থাকছে কিনা এসব নিয়ে অনেক চিন্তাভাবনার প্রয়োজন আছে বলে মনে করেন রেবেকা ডেমন।

প্রতিবেদন তৈরিতে সহযোগিতা করেছেন উইল স্মেল।

শেয়ার করুন

এ জাতীয় আরো খবর

ভ্রমন সম্পর্কিত সকল নিউজ এবং সব ধরনের তথ্য সবার আগে পেতে, আমাদের সাথে থাকুন এবং আমাদেরকে ফলো করে রাখুন।

© All rights reserved © 2020 cholojaai.net
Theme Customized By ThemesBazar.Com