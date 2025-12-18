ନୂଆଦିଲ୍ଲୀ:ଗୁଗୁଲ୍ ଏବେ ଏକ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ରିପୋର୍ଟ ପ୍ରକାଶ କରିଛି, ଯେଉଁଥିରେ ଏଆଇ ଚାଟବଟ୍ସର ସଠିକତା ବିଷୟରେ ଆଶ୍ଚର୍ଯ୍ୟଜନକ ରିପୋର୍ଟ ପ୍ରକାଶ କରାଯାଇଛି। ଗୁଗୁଲ୍ର ନୂତନ ଫ୍ୟାକ୍ସ୍ ବେଞ୍ଚମାର୍କ ସୁଟ୍ ମାଧ୍ୟମରେ ଏହା ସାମ୍ନାକୁ ଆସିଛି ଯେ, ବିଶ୍ୱର ସବୁଠାରୁ ଶକ୍ତିଶାଳୀ ଏଆଇ ମଡେଲ୍ଗୁଡ଼ିକ ମଧ୍ୟ ତଥ୍ୟର ଦୃଷ୍ଟିରୁ ସମ୍ପୂର୍ଣ୍ଣ ନିର୍ଭରଯୋଗ୍ୟ ନୁହେଁ। ରିପୋର୍ଟ ଅନୁଯାୟୀ, କୌଣସି ବଡ଼ ଏଆଇ ମଡେଲର ତଥ୍ୟଗତ ୭୦ ପ୍ରତିଶତରୁ ଅଧିକ ନୁହେଁ। ସରଳ ଶବ୍ଦରେ, ଏଆଇ ଚାଟବଟ୍ଗୁଡ଼ିକ ପ୍ରତି ତିନୋଟି ଉତ୍ତର ମଧ୍ୟରୁ ଗୋଟିଏକୁ ଭୁଲ୍ ଦେଉଛନ୍ତି।
ଗୁଗୁଲ୍ ଜେମିନି ୩ ପ୍ରୋ ସବୁଠାରୁ ଠିକ୍ ଥିଲା
ଗୁଗୁଲର ବେଞ୍ଚମାର୍କ ପରୀକ୍ଷଣରେ, କମ୍ପାନିର ଜେମିନି ୩ ପ୍ରୋ ମଡେଲ ଶୀର୍ଷରେ ଆସିଥିଲା। ଏହି ମଡେଲ ୬୯ ପ୍ରତିଶତ ତଥ୍ୟଗତ ସଠିକତା ହାସଲ କରିଥିଲା, ଯାହା ସମସ୍ତ ପ୍ରତିଯୋଗୀ AI ସିଷ୍ଟମକୁ ପଛରେ ପକାଇ ଦେଇଥିଲା। OpenAI , Anthropic, ଏବଂ ଏଲନ୍ ମସ୍କଙ୍କ କମ୍ପାନୀ xAI ର ମଡେଲଗୁଡ଼ିକ ଏହି ସ୍ତରକୁ ପହଞ୍ଚିପାରି ନଥିଲେ। ରିପୋର୍ଟ ଅନୁଯାୟୀ, ଜେମିନି ୨.୫ ପ୍ରୋ ଏବଂ ଚାଟଜିପିଟି୫, ୬୨ ପ୍ରତିଶତ ସଠିକତା ହାସଲ କରିଛି। କ୍ଲାଉଡ ୪.୫ ଓପସ୍ ୫୧ ପ୍ରତିଶତ ସଠିକତା ହାସଲ କରିଛି। ଏବଂ ଗ୍ରୋକ୍ ୪ ପ୍ରାୟ ୫୪ ପ୍ରତିଶତ ହାସଲ କରିଛି।
ଗୁଗୁଲର FACTS ବେଞ୍ଚମାର୍କ ପରୀକ୍ଷା କ’ଣ?
ଗୁଗୁଲର ଏହି ବେଞ୍ଚମାର୍କ ପରୀକ୍ଷା ପାରମ୍ପରିକ ପଦ୍ଧତିଠାରୁ ଭିନ୍ନ ଭାବରେ AI ମଡେଲଗୁଡ଼ିକର କ୍ଷମତା ପରୀକ୍ଷା କରେ। ସାଧାରଣତଃ AI ପରୀକ୍ଷାରେ ମଡେଲକୁ ପାଠ୍ୟ ସାରାଂଶ ତିଆରି କରିବା, ପ୍ରଶ୍ନର ଉତ୍ତର ଦେବା କିମ୍ବା କୋଡ୍ ଲେଖାଯାଇଥାଏ।
ଏଆଇ ମଡେଲଗୁଡ଼ିକ ଚାରୋଟି ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ପରୀକ୍ଷା ଦେଇ ଗତି କରନ୍ତି
* ପ୍ରଥମ ପରୀକ୍ଷଣରେ ଦେଖାଯାଏ ଯେ AI ମଡେଲ୍ କେବଳ ଏହାର ତାଲିମ ତଥ୍ୟ ଉପରେ ଆଧାର କରି ତଥ୍ୟଗତ ଉତ୍ତର ଦେଇପାରିବ କି ନାହିଁ।
* ଦ୍ୱିତୀୟ ପରୀକ୍ଷା ମଡେଲର ସନ୍ଧାନ କାର୍ଯ୍ୟଦକ୍ଷତାର ମୂଲ୍ୟାଙ୍କନ କରେ।
* ତୃତୀୟ ପରୀକ୍ଷା ଯାଞ୍ଚ କରେ ଯେ ନୂତନ କିମ୍ବା ଅତିରିକ୍ତ ତଥ୍ୟ ପ୍ରଚଳନ ସମୟରେ ମଡେଲଟି ଡକ୍ୟୁମେଣ୍ଟ ସହିତ କେତେ ଭଲ ଭାବରେ ଖାପ ଖାଏ।
* ଚତୁର୍ଥ ଏବଂ ଅନ୍ତିମ ପରୀକ୍ଷା ମଡେଲର ଚାର୍ଟ, ଡାଇଗ୍ରାମ ଏବଂ ପ୍ରତିଛବି ଭଳି ବହୁମୁଖୀ ବୁଝାମଣା ବୁଝିବାର କ୍ଷମତାର ମୂଲ୍ୟାଙ୍କନ କରେ।
ଉପଭୋକ୍ତାମାନଙ୍କ ପାଇଁ ଶିକ୍ଷା
ଏହି ଗୁଗୁଲ୍ ରିପୋର୍ଟ ସ୍ପଷ୍ଟ ଭାବରେ ସୂଚାଇ ଦେଉଛି ଯେ ଏଆଇ ଚାଟବଟ୍ସ୍ଗୁଡ଼ିକୁ ଚୁଡ଼ାନ୍ତ ଭାବରେ ଗ୍ରହଣ କରିବା ବିପଦପୂର୍ଣ୍ଣ ହୋଇପାରେ। ଏଆଇ ପ୍ରତିକ୍ରିୟାଗୁଡ଼ିକର କ୍ରସ-ଚେକିଂ ଅତ୍ୟନ୍ତ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ। ବିଶେଷକରି ଯେତେବେଳେ ଏହା ଖବର, ଡାକ୍ତରୀ ସୂଚନା କିମ୍ବା ସମ୍ବେଦନଶୀଳ ନିଷ୍ପତ୍ତି ବିଷୟରେ ଆସେ ଠିକ୍ ଭାବେ ପରିଖିନେବା ଜରୁରୀ।
