টারনিটিন কি গবেষণায় চৌর্যবৃত্তি শনাক্তকরণ টুল?
jugantor
টারনিটিন কি গবেষণায় চৌর্যবৃত্তি শনাক্তকরণ টুল?

  ড. মুহাম্মদ খাইরুল আমিন  

০৮ জুন ২০২১, ১৮:০৩:৩৮  |  অনলাইন সংস্করণ

সাধারণ মানুষ তো বটেই, এমনকি শিক্ষাসংশ্লিষ্ট অনেক নীতিনির্ধারক ও শিক্ষাবিদের মাঝেই একটি ভুল ধারণা প্রচলিত আছে যে, ‘টারনিটিন’ হচ্ছে একাডেমিক গবেষণায় প্ল্যাজারিজম বা চৌর্যবৃত্তি শনাক্তকরণ সফটওয়্যার।

এটিকে মূলত একটি ‘টেক্সট-ম্যাচিং টুল’ হিসাবে ধরা যায়, যা বিভিন্ন ওয়েবসাইট ও ইন্টারনেটে রক্ষিত ডেটাবেসের বিপরীতে অনুরূপ টেক্সটের সাদৃশ্যগুলো নিরূপণ করে থাকে।

এ ছাড়া টারনিটিন নিজেও সরাসরি দাবি করে না এটি প্ল্যাজারিজম বা চৌর্যবৃত্তি শনাক্তকরণ টুল। একাডেমিক গবেষণায় প্ল্যাজারিজম বা চৌর্যবৃত্তি শনাক্তকরণ একটি সম্পূর্ণ একাডেমিক ও স্পর্শকাতর বিষয়, যা বিভিন্ন ফ্যাক্টর বা বিষয়ের ওপর নির্ভর করে এবং সংশ্লিষ্ট বিষয়ে বিশেষজ্ঞরা কেবল এ কাজটি করতে পারেন।

টারনিটিন বা অনুরূপ সফটওয়্যার শুধু সিমিলারিটি ইনডেক্স বা সাদৃশ্য সূচকের ওপর ভিত্তি করে যে ধরনের ‘অরিজিনালিটি রিপোর্ট’ তৈরি করে, তা অবশ্যই একজন বিষয়ভিত্তিক বিশেষজ্ঞ দ্বারা ব্যাখ্যা করা প্রয়োজন।

টারনিটিন দ্বারা কোনো একটি গবেষণা বা প্রকাশিত নিবন্ধের ‘অরিজিনালিটি রিপোর্ট’ তৈরি করার আগে ওই গবেষণা বা প্রকাশনার রেফারেন্স বা বিব্লিওগ্রাফি, উদ্ধৃত অংশগুলো, সংক্ষেপণ, গ্রাফ বা ছবি, সারণি, সায়েন্টিফিক বা টেকনিক্যাল ও বহুল প্রচলিত শব্দ বা বাক্যাংশ অবশ্যই বাদ দেওয়া উচিত।

সফটওয়্যার প্রদত্ত শুধু সিমিলারিটি ইনডেক্স বা সাদৃশ্য সূচকের ওপর নির্ভর করে প্ল্যাজারিজম বা চৌর্যবৃত্তি নিরূপণে সিদ্ধান্ত গ্রহণ মোটেও বুদ্ধিমানের কাজ নয়; বরং এ ক্ষেত্রে গবেষণা প্রবন্ধের প্রতিটি উপাদান আলাদাভাবে অবশ্যই ম্যানুয়ালি বা ব্যক্তিগতভাবে পরীক্ষা-নিরীক্ষা করা অত্যাবশ্যক।

এটি কোনো একক উৎস থেকে নেওয়া হয়েছে নাকি বিভিন্ন উৎসের ছোট ছোট অংশ থেকে সংগ্রহ করা হয়েছে, তা ভালোভাবে পর্যালোচনা করে তারপর বিবেচনায় নিতে হবে। এ ছাড়া মিলে যাওয়া অংশগুলো ওই নিবন্ধে সঠিকভাবে উদ্ধৃত করা হয়েছে কিনা তাও খতিয়ে দেখতে হবে।

কখনো কখনো টারনিটিন দ্বারা যাচাইকৃত সিমিলারিটি ইনডেক্স বা সাদৃশ্য সূচকের ফলাফল নিজের প্রকাশনা উৎসের সঙ্গেও মিলে যেতে দেখা যায়, যা অনেক ক্ষেত্রে ৯০ শতাংশেরও বেশি হতে পারে। এ ক্ষেত্রে মিলে যাওয়া প্রতিটি উৎস ভালোমতো পরীক্ষা-নিরীক্ষা করে ‘অরিজিনালিটি রিপোর্ট’ বিশ্লেষণ করতে হবে।

যদি দেখা যায়, মিলিত উৎসটি নিজেই নিজের প্রকাশনা প্রবন্ধ বা তার অংশবিশেষ সেক্ষেত্রে টারনিটিন দ্বারা চেক করার আগে ওই প্রকাশনার উৎসটি সমূলে বাদ দিতে হয়।

এ ছাড়া কোনো গবেষকের পিএইচডি বা গবেষণা থিসিস পেপার যদি ডিগ্রি প্রদানকারী শিক্ষাপ্রতিষ্ঠানের গ্রন্থাগার রিপোজিটরিতে সংরক্ষিত থাকে, গবেষক তার ব্যক্তিগত বা প্রাতিষ্ঠানিক কোনো সাইটে দিয়ে রাখে অথবা ওই থিসিস থেকে এক বা একাধিক জার্নালে নিবন্ধ প্রকাশিত হয় এবং সেই নিবন্ধগুলো বিভিন্ন সাইটে দেওয়া থাকে অথবা একই লেখা বা তার সারাংশ একাধিক উৎসে জমা থাকে, তাহলে টারনিটিন তার সবগুলো সামষ্টিক আকারে সিমিলারিটি রিপোর্ট দিয়ে থাকে।

আরেকটি মজার ব্যাপার হলো, টারনিটিন দ্বারা কোনো একটি প্রবন্ধ চেক করার সময় তা ওই প্রবন্ধটি প্রকাশিত হওয়ার পূর্বাপর সব উৎস থেকে প্রাপ্ত তথ্য প্রদান করে, এ ক্ষেত্রে পরে প্রকাশিত উৎসগুলো অবশ্যই বাদ দিতে হবে।

অনেক সময় এমনটিও লক্ষণীয় যে, একই প্রকাশনা বা গবেষণা প্রবন্ধ ও নিবন্ধ একবার টারনিটিন দ্বারা চেক করার পর যদি তা টারনিটিনের রিপোজিটরি বা সংরক্ষণাগার থেকে বাদ দেওয়া না হয়, তাহলে পরে ওই প্রকাশনা বা গবেষণা প্রবন্ধটির সিমিলারিটি ইনডেক্স বা সাদৃশ্য সূচক ১০০ শতাংশ বা তার কাছাকাছি পাওয়া যাবে।

এ বিষয়টি খুবই গুরুত্বপূর্ণ যে, সিমিলারিটি ইনডেক্স বা সাদৃশ্য সূচক দ্বারা প্ল্যাজারিজম বা গবেষণায় চৌর্যবৃত্তি শনাক্তকরণ কতটুকু হয়েছে তা পুরোপুরি বলা যাবে না; কারণ সিমিলারিটি ইনডেক্স বা সাদৃশ্য সূচক ও প্ল্যাজারিজম বা চৌর্যবৃত্তি এ দুটি উপাদানের মধ্যে রয়েছে বিশাল পার্থক্য।

এটি অনুধাবন করার জন্য একটি উদাহরণ দিচ্ছি। একটি নিবন্ধে প্রচুর শব্দ, সংক্ষেপণ, পরীক্ষার নাম, রোগ ও উপসর্গ ইত্যাদি থাকে। কেউ চাইলেও এগুলোর পরিবর্তন বা প্যারাফ্রেজ করতে পারবে না এবং এ ক্ষেত্রে পুরো বাক্যটিও অনুরূপভাবেই লিখতে হবে।

এখানে টারনিটিন যদি ৬৪ শতাংশ সিমিলারিটি ইনডেক্স বা সাদৃশ্য সূচক দেখায়, তার মানে ৬৪ শতাংশ প্ল্যাজারিজম বা চৌর্যবৃত্তি হয়েছে- ব্যাপারটি কিন্তু তা নয়।

এর মানে হলো, ইতোমধ্যে প্রকাশিত বিভিন্ন প্রকাশনার সঙ্গে ৬৪ শতাংশ মিলেছে, যার মধ্যে ইন্টারনেটে পাওয়া কোটি কোটি পৃষ্ঠা অন্তর্ভুক্ত থাকতে পারে, যাকে ঠিক প্ল্যাজারিজম বা চৌর্যবৃত্তি হিসাবে গণ্য করা যায় না (তথ্যসূত্র : সৌদি জার্নাল অব এনেসথেশিয়া, এপ্রিল ২০১৯)।

বিশেষজ্ঞরা মনে করেন, নানা কারণে টারনিটিনের মতো সফটওয়্যারের মাধ্যমে একাডেমিক গবেষণায় প্ল্যাজারিজম বা চৌর্যবৃত্তি শনাক্তকরণ ও মূল্যায়ন করা নৈতিকভাবে প্রশ্নবিদ্ধ ও ত্রুটিযুক্ত। কারণ টারনিটিন বা এ ধরনের সফটওয়্যার তাদের অসম্পূর্ণ ডেটাবেসগুলোর কারণে প্ল্যাজারিজম বা চৌর্যবৃত্তির প্রতিটি বিষয় সঠিকভাবে শনাক্ত করতে পারে না।

এমনকি এ সফটওয়্যার সার্চ ইঞ্জিনের ইন্ডেক্সবহির্ভূত কোনো প্রকাশনা যেমন- ছাপা গ্রন্থ, সাময়িকী ও পত্রিকার অংশ কিংবা ইংরেজি ছাড়া অন্য কোনো ভাষা যেমন বাংলা ইত্যাদি উৎসের সিমিলারিটি ইনডেক্স বা সাদৃশ্য সূচক শনাক্ত করতে সম্পূর্ণভাবে অক্ষম।

সুতরাং টারনিটিন একটি প্ল্যাজারিজম বা চৌর্যবৃত্তি শনাক্তকরণ সফটওয়্যার বা টুল নয়। তবে এটি একটি পাঠ্য মিলে যাওয়া সরঞ্জাম বা নথির সাদৃশ্য সরবরাহ করে, বলা যায়।

ড. মুহাম্মদ খাইরুল আমিন: ন্যানো-মেডিসিন গবেষক, গ্রিনিচ বিশ্ববিদ্যালয়, যুক্তরাজ্য

টারনিটিন কি গবেষণায় চৌর্যবৃত্তি শনাক্তকরণ টুল?

 ড. মুহাম্মদ খাইরুল আমিন 
০৮ জুন ২০২১, ০৬:০৩ পিএম  |  অনলাইন সংস্করণ

সাধারণ মানুষ তো বটেই, এমনকি শিক্ষাসংশ্লিষ্ট অনেক নীতিনির্ধারক ও শিক্ষাবিদের মাঝেই একটি ভুল ধারণা প্রচলিত আছে যে, ‘টারনিটিন’ হচ্ছে একাডেমিক গবেষণায় প্ল্যাজারিজম বা চৌর্যবৃত্তি শনাক্তকরণ সফটওয়্যার। 

এটিকে মূলত একটি ‘টেক্সট-ম্যাচিং টুল’ হিসাবে ধরা যায়, যা বিভিন্ন ওয়েবসাইট ও ইন্টারনেটে রক্ষিত ডেটাবেসের বিপরীতে অনুরূপ টেক্সটের সাদৃশ্যগুলো নিরূপণ করে থাকে। 

এ ছাড়া টারনিটিন নিজেও সরাসরি দাবি করে না এটি প্ল্যাজারিজম বা চৌর্যবৃত্তি শনাক্তকরণ টুল। একাডেমিক গবেষণায় প্ল্যাজারিজম বা চৌর্যবৃত্তি শনাক্তকরণ একটি সম্পূর্ণ একাডেমিক ও স্পর্শকাতর বিষয়, যা বিভিন্ন ফ্যাক্টর বা বিষয়ের ওপর নির্ভর করে এবং সংশ্লিষ্ট বিষয়ে বিশেষজ্ঞরা কেবল এ কাজটি করতে পারেন। 

টারনিটিন বা অনুরূপ সফটওয়্যার শুধু সিমিলারিটি ইনডেক্স বা সাদৃশ্য সূচকের ওপর ভিত্তি করে যে ধরনের ‘অরিজিনালিটি রিপোর্ট’ তৈরি করে, তা অবশ্যই একজন বিষয়ভিত্তিক বিশেষজ্ঞ দ্বারা ব্যাখ্যা করা প্রয়োজন।        

টারনিটিন দ্বারা কোনো একটি গবেষণা বা প্রকাশিত নিবন্ধের ‘অরিজিনালিটি রিপোর্ট’ তৈরি করার আগে ওই গবেষণা বা প্রকাশনার রেফারেন্স বা বিব্লিওগ্রাফি, উদ্ধৃত অংশগুলো, সংক্ষেপণ, গ্রাফ বা ছবি, সারণি, সায়েন্টিফিক বা টেকনিক্যাল ও বহুল প্রচলিত শব্দ বা বাক্যাংশ অবশ্যই বাদ দেওয়া উচিত। 

সফটওয়্যার প্রদত্ত শুধু সিমিলারিটি ইনডেক্স বা সাদৃশ্য সূচকের ওপর নির্ভর করে প্ল্যাজারিজম বা চৌর্যবৃত্তি নিরূপণে সিদ্ধান্ত গ্রহণ মোটেও বুদ্ধিমানের কাজ নয়; বরং এ ক্ষেত্রে গবেষণা প্রবন্ধের প্রতিটি উপাদান আলাদাভাবে অবশ্যই ম্যানুয়ালি বা ব্যক্তিগতভাবে পরীক্ষা-নিরীক্ষা করা অত্যাবশ্যক। 

এটি কোনো একক উৎস থেকে নেওয়া হয়েছে নাকি বিভিন্ন উৎসের ছোট ছোট অংশ থেকে সংগ্রহ করা হয়েছে, তা ভালোভাবে পর্যালোচনা করে তারপর বিবেচনায় নিতে হবে। এ ছাড়া মিলে যাওয়া অংশগুলো ওই নিবন্ধে সঠিকভাবে উদ্ধৃত করা হয়েছে কিনা তাও খতিয়ে দেখতে হবে।  

কখনো কখনো টারনিটিন দ্বারা যাচাইকৃত সিমিলারিটি ইনডেক্স বা সাদৃশ্য সূচকের ফলাফল নিজের প্রকাশনা উৎসের সঙ্গেও মিলে যেতে দেখা যায়, যা অনেক ক্ষেত্রে ৯০ শতাংশেরও বেশি হতে পারে। এ ক্ষেত্রে মিলে যাওয়া প্রতিটি উৎস ভালোমতো পরীক্ষা-নিরীক্ষা করে ‘অরিজিনালিটি রিপোর্ট’ বিশ্লেষণ করতে হবে। 

যদি দেখা যায়, মিলিত উৎসটি নিজেই নিজের প্রকাশনা প্রবন্ধ বা তার অংশবিশেষ সেক্ষেত্রে টারনিটিন দ্বারা চেক করার আগে ওই প্রকাশনার উৎসটি সমূলে বাদ দিতে হয়। 

এ ছাড়া কোনো গবেষকের পিএইচডি বা গবেষণা থিসিস পেপার যদি ডিগ্রি প্রদানকারী শিক্ষাপ্রতিষ্ঠানের গ্রন্থাগার রিপোজিটরিতে সংরক্ষিত থাকে, গবেষক তার ব্যক্তিগত বা প্রাতিষ্ঠানিক কোনো সাইটে দিয়ে রাখে অথবা ওই থিসিস থেকে এক বা একাধিক জার্নালে নিবন্ধ প্রকাশিত হয় এবং সেই নিবন্ধগুলো বিভিন্ন সাইটে দেওয়া থাকে অথবা একই লেখা বা তার সারাংশ একাধিক উৎসে জমা থাকে, তাহলে টারনিটিন তার সবগুলো সামষ্টিক আকারে সিমিলারিটি রিপোর্ট দিয়ে থাকে। 

আরেকটি মজার ব্যাপার হলো, টারনিটিন দ্বারা কোনো একটি প্রবন্ধ চেক করার সময় তা ওই প্রবন্ধটি প্রকাশিত হওয়ার পূর্বাপর সব উৎস থেকে প্রাপ্ত তথ্য প্রদান করে, এ ক্ষেত্রে পরে প্রকাশিত উৎসগুলো অবশ্যই বাদ দিতে হবে। 

অনেক সময় এমনটিও লক্ষণীয় যে, একই প্রকাশনা বা গবেষণা প্রবন্ধ ও নিবন্ধ একবার টারনিটিন দ্বারা চেক করার পর যদি তা টারনিটিনের রিপোজিটরি বা সংরক্ষণাগার থেকে বাদ দেওয়া না হয়, তাহলে পরে ওই প্রকাশনা বা গবেষণা প্রবন্ধটির সিমিলারিটি ইনডেক্স বা সাদৃশ্য সূচক ১০০ শতাংশ বা তার কাছাকাছি পাওয়া যাবে।    

এ বিষয়টি খুবই গুরুত্বপূর্ণ যে, সিমিলারিটি ইনডেক্স বা সাদৃশ্য সূচক দ্বারা প্ল্যাজারিজম বা গবেষণায় চৌর্যবৃত্তি শনাক্তকরণ কতটুকু হয়েছে তা পুরোপুরি বলা যাবে না; কারণ সিমিলারিটি ইনডেক্স বা সাদৃশ্য সূচক ও প্ল্যাজারিজম বা চৌর্যবৃত্তি এ দুটি উপাদানের মধ্যে রয়েছে বিশাল পার্থক্য। 

এটি অনুধাবন করার জন্য একটি উদাহরণ দিচ্ছি। একটি নিবন্ধে প্রচুর শব্দ, সংক্ষেপণ, পরীক্ষার নাম, রোগ ও উপসর্গ ইত্যাদি থাকে। কেউ চাইলেও এগুলোর পরিবর্তন বা প্যারাফ্রেজ করতে পারবে না এবং এ ক্ষেত্রে পুরো বাক্যটিও অনুরূপভাবেই লিখতে হবে। 

এখানে টারনিটিন যদি ৬৪ শতাংশ সিমিলারিটি ইনডেক্স বা সাদৃশ্য সূচক দেখায়, তার মানে ৬৪ শতাংশ প্ল্যাজারিজম বা চৌর্যবৃত্তি হয়েছে- ব্যাপারটি কিন্তু তা নয়। 

এর মানে হলো, ইতোমধ্যে প্রকাশিত বিভিন্ন প্রকাশনার সঙ্গে ৬৪ শতাংশ মিলেছে, যার মধ্যে ইন্টারনেটে পাওয়া কোটি কোটি পৃষ্ঠা অন্তর্ভুক্ত থাকতে পারে, যাকে ঠিক প্ল্যাজারিজম বা চৌর্যবৃত্তি হিসাবে গণ্য করা যায় না (তথ্যসূত্র : সৌদি জার্নাল অব এনেসথেশিয়া, এপ্রিল ২০১৯)। 

বিশেষজ্ঞরা মনে করেন, নানা কারণে টারনিটিনের মতো সফটওয়্যারের মাধ্যমে একাডেমিক গবেষণায় প্ল্যাজারিজম বা চৌর্যবৃত্তি শনাক্তকরণ ও মূল্যায়ন করা নৈতিকভাবে প্রশ্নবিদ্ধ ও ত্রুটিযুক্ত। কারণ টারনিটিন বা এ ধরনের সফটওয়্যার তাদের অসম্পূর্ণ ডেটাবেসগুলোর কারণে প্ল্যাজারিজম বা চৌর্যবৃত্তির প্রতিটি বিষয় সঠিকভাবে শনাক্ত করতে পারে না। 

এমনকি এ সফটওয়্যার সার্চ ইঞ্জিনের ইন্ডেক্সবহির্ভূত কোনো প্রকাশনা যেমন- ছাপা গ্রন্থ, সাময়িকী ও পত্রিকার অংশ কিংবা ইংরেজি ছাড়া অন্য কোনো ভাষা যেমন বাংলা ইত্যাদি উৎসের সিমিলারিটি ইনডেক্স বা সাদৃশ্য সূচক শনাক্ত করতে সম্পূর্ণভাবে অক্ষম। 

সুতরাং টারনিটিন একটি প্ল্যাজারিজম বা চৌর্যবৃত্তি শনাক্তকরণ সফটওয়্যার বা টুল নয়। তবে এটি একটি পাঠ্য মিলে যাওয়া সরঞ্জাম বা নথির সাদৃশ্য সরবরাহ করে, বলা যায়। 

ড. মুহাম্মদ খাইরুল আমিন: ন্যানো-মেডিসিন গবেষক, গ্রিনিচ বিশ্ববিদ্যালয়, যুক্তরাজ্য 

যুগান্তর ইউটিউব চ্যানেলে সাবস্ক্রাইব করুন