AI Catbots: AI ଚାଟ୍‌ବଟ୍‌ସକୁ ଅନ୍ଧ ଭଳି ବିଶ୍ୱାସ କରିବା ହୋଇପାରେ ବିପଦ!

Advertisment

ଗୁଗୁଲ୍ ଏବେ ଏକ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ରିପୋର୍ଟ ପ୍ରକାଶ କରିଛି, ଯେଉଁଥିରେ ଏଆଇ ଚାଟବଟ୍‌ସର ସଠିକତା ବିଷୟରେ ଆଶ୍ଚର୍ଯ୍ୟଜନକ ରିପୋର୍ଟ ପ୍ରକାଶ କରାଯାଇଛି। ଗୁଗୁଲ୍‌ର ନୂତନ ଫ୍ୟାକ୍ସ୍‌ ବେଞ୍ଚମାର୍କ ସୁଟ୍ ମାଧ୍ୟମରେ ଏହା ସାମ୍ନାକୁ ଆସିଛି।

ଗୁଗୁଲ୍ ଏବେ ଏକ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ରିପୋର୍ଟ ପ୍ରକାଶ କରିଛି, ଯେଉଁଥିରେ ଏଆଇ ଚାଟବଟ୍‌ସର ସଠିକତା ବିଷୟରେ ଆଶ୍ଚର୍ଯ୍ୟଜନକ ରିପୋର୍ଟ ପ୍ରକାଶ କରାଯାଇଛି। ଗୁଗୁଲ୍‌ର ନୂତନ ଫ୍ୟାକ୍ସ୍‌ ବେଞ୍ଚମାର୍କ ସୁଟ୍ ମାଧ୍ୟମରେ ଏହା ସାମ୍ନାକୁ ଆସିଛି।

Untitled-24

Photograph: (sambad.in)

ନୂଆଦିଲ୍ଲୀ: ଗୁଗୁଲ୍ ଏବେ ଏକ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ରିପୋର୍ଟ ପ୍ରକାଶ କରିଛି, ଯେଉଁଥିରେ ଏଆଇ ଚାଟବଟ୍ସର ସଠିକତା ବିଷୟରେ ଆଶ୍ଚର୍ଯ୍ୟଜନକ ରିପୋର୍ଟ ପ୍ରକାଶ କରାଯାଇଛି। ଗୁଗୁଲ୍‌ର ନୂତନ ଫ୍ୟାକ୍ସ୍‌ ବେଞ୍ଚମାର୍କ ସୁଟ୍ ମାଧ୍ୟମରେ ଏହା ସାମ୍ନାକୁ ଆସିଛି ଯେ, ବିଶ୍ୱର ସବୁଠାରୁ ଶକ୍ତିଶାଳୀ ଏଆଇ ମଡେଲ୍‌ଗୁଡ଼ିକ ମଧ୍ୟ ତଥ୍ୟର ଦୃଷ୍ଟିରୁ ସମ୍ପୂର୍ଣ୍ଣ ନିର୍ଭରଯୋଗ୍ୟ ନୁହେଁ। ରିପୋର୍ଟ ଅନୁଯାୟୀ, କୌଣସି ବଡ଼ ଏଆଇ ମଡେଲର ତଥ୍ୟଗତ ୭୦ ପ୍ରତିଶତରୁ ଅଧିକ ନୁହେଁ। ସରଳ ଶବ୍ଦରେ, ଏଆଇ ଚାଟବଟ୍‌ଗୁଡ଼ିକ ପ୍ରତି ତିନୋଟି ଉତ୍ତର ମଧ୍ୟରୁ ଗୋଟିଏକୁ ଭୁଲ‌୍ ଦେଉଛନ୍ତି।

ଗୁଗୁଲ୍ ଜେମିନି ୩ ପ୍ରୋ ସବୁଠାରୁ ଠିକ୍ ଥିଲା

ଗୁଗୁଲର ବେଞ୍ଚମାର୍କ ପରୀକ୍ଷଣରେ, କମ୍ପାନିର ଜେମିନି ୩ ପ୍ରୋ ମଡେଲ ଶୀର୍ଷରେ ଆସିଥିଲା। ଏହି ମଡେଲ ୬୯ ପ୍ରତିଶତ ତଥ୍ୟଗତ ସଠିକତା ହାସଲ କରିଥିଲା, ଯାହା ସମସ୍ତ ପ୍ରତିଯୋଗୀ AI ସିଷ୍ଟମକୁ ପଛରେ ପକାଇ ଦେଇଥିଲା। OpenAI , Anthropic, ଏବଂ ଏଲନ୍‌ ମସ୍କଙ୍କ କମ୍ପାନୀ xAI ର ମଡେଲଗୁଡ଼ିକ ଏହି ସ୍ତରକୁ ପହଞ୍ଚିପାରି ନଥିଲେ। ରିପୋର୍ଟ ଅନୁଯାୟୀ, ଜେମିନି ୨.୫ ପ୍ରୋ ଏବଂ ଚାଟଜିପିଟି୫, ୬୨ ପ୍ରତିଶତ ସଠିକତା ହାସଲ କରିଛି। କ୍ଲାଉଡ ୪.୫ ଓପସ୍ ୫୧ ପ୍ରତିଶତ ସଠିକତା ହାସଲ କରିଛି। ଏବଂ ଗ୍ରୋକ୍ ୪ ପ୍ରାୟ ୫୪ ପ୍ରତିଶତ ହାସଲ କରିଛି। 

ଗୁଗୁଲର FACTS ବେଞ୍ଚମାର୍କ ପରୀକ୍ଷା କ’ଣ?

ଗୁଗୁଲର ଏହି ବେଞ୍ଚମାର୍କ ପରୀକ୍ଷା ପାରମ୍ପରିକ ପଦ୍ଧତିଠାରୁ ଭିନ୍ନ ଭାବରେ AI ମଡେଲଗୁଡ଼ିକର କ୍ଷମତା ପରୀକ୍ଷା କରେ। ସାଧାରଣତଃ AI ପରୀକ୍ଷାରେ ମଡେଲକୁ ପାଠ୍ୟ ସାରାଂଶ ତିଆରି କରିବା, ପ୍ରଶ୍ନର ଉତ୍ତର ଦେବା କିମ୍ବା କୋଡ୍ ଲେଖାଯାଇଥାଏ। 

ଆହୁରି ପଢ଼ନ୍ତୁ: ଡ଼ିଏମକେକୁ କଡା ଭାଷାରେ ଟାର୍ଗେଟ କଲେ ବିଜୟ

ଏଆଇ ମଡେଲଗୁଡ଼ିକ ଚାରୋଟି ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ପରୀକ୍ଷା ଦେଇ ଗତି କରନ୍ତି

* ପ୍ରଥମ ପରୀକ୍ଷଣରେ ଦେଖାଯାଏ ଯେ AI ମଡେଲ୍ କେବଳ ଏହାର ତାଲିମ ତଥ୍ୟ ଉପରେ ଆଧାର କରି ତଥ୍ୟଗତ ଉତ୍ତର ଦେଇପାରିବ କି ନାହିଁ।
* ଦ୍ୱିତୀୟ ପରୀକ୍ଷା ମଡେଲର ସନ୍ଧାନ କାର୍ଯ୍ୟଦକ୍ଷତାର ମୂଲ୍ୟାଙ୍କନ କରେ।
* ତୃତୀୟ ପରୀକ୍ଷା ଯାଞ୍ଚ କରେ ଯେ ନୂତନ କିମ୍ବା ଅତିରିକ୍ତ ତଥ୍ୟ ପ୍ରଚଳନ ସମୟରେ ମଡେଲଟି ଡକ୍ୟୁମେଣ୍ଟ ସହିତ କେତେ ଭଲ ଭାବରେ ଖାପ ଖାଏ।
* ଚତୁର୍ଥ ଏବଂ ଅନ୍ତିମ ପରୀକ୍ଷା ମଡେଲର ଚାର୍ଟ, ଡାଇଗ୍ରାମ ଏବଂ ପ୍ରତିଛବି ଭଳି ବହୁମୁଖୀ ବୁଝାମଣା ବୁଝିବାର କ୍ଷମତାର ମୂଲ୍ୟାଙ୍କନ କରେ।

ଉପଭୋକ୍ତାମାନଙ୍କ ପାଇଁ  ଶିକ୍ଷା

ଏହି ଗୁଗୁଲ୍ ରିପୋର୍ଟ ସ୍ପଷ୍ଟ ଭାବରେ ସୂଚାଇ ଦେଉଛି ଯେ ଏଆଇ ଚାଟବଟ୍ସ୍‌ଗୁଡ଼ିକୁ ଚୁଡ଼ାନ୍ତ ଭାବରେ ଗ୍ରହଣ କରିବା ବିପଦପୂର୍ଣ୍ଣ ହୋଇପାରେ। ଏଆଇ ପ୍ରତିକ୍ରିୟାଗୁଡ଼ିକର କ୍ରସ-ଚେକିଂ ଅତ୍ୟନ୍ତ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ। ବିଶେଷକରି ଯେତେବେଳେ ଏହା ଖବର, ଡାକ୍ତରୀ ସୂଚନା କିମ୍ବା ସମ୍ବେଦନଶୀଳ ନିଷ୍ପତ୍ତି ବିଷୟରେ ଆସେ ଠିକ୍‌ ଭାବେ ପରିଖିନେବା ଜରୁରୀ। 

ଆହୁରି ପଢ଼ନ୍ତୁ: ମହାକାଶରେ ମହାବିସ୍ଫୋରଣ, ପ୍ରତ୍ୟକ୍ଷ ପ୍ରମାଣ ପାଇଲେ ବୈଜ୍ଞାନିକ

ସମ୍ବନ୍ଧୀୟ ପ୍ରବନ୍ଧଗୁଡ଼ିକ
Here are a few more articles:
ପରବର୍ତ୍ତୀ ପ୍ରବନ୍ଧ ପ Read ଼ନ୍ତୁ
Subscribe