(ઓફર ટૂંક સમયમાં પૂરી થાય છે)

પ્રજ્ઞાચક્ષુઓ માટે તસવીરોનું વર્ણન કરી આપતી ટેક્નોલોજી

પ્રજ્ઞાચક્ષુઓની સુવિધા માટે સ્ક્રીન રીડર સોફ્ટવેર વેબપેજનું લખાણ વાંચી સંભળવતા હોય છે. આ સોફ્ટવેર ઇમેજનું વર્ણન – જો વેબપેજ ડેવલપરે આપ્યું ન હોય તો – કરી શકતા નથી. આ ઉણપ પૂરી કરે છે નવી ટેક્નોલોજી.

જે વ્યક્તિને કંઈ દેખાતું ન હોય એને માટે આપણી ભાષામાં એક સરસ શબ્દ છે – પ્રજ્ઞાચક્ષુ.

પ્રજ્ઞાચક્ષુ એટલે એવી વ્યક્તિ જે અન્ય વ્યક્તિઓની જેમ સાદી આંખથી નહીં પરંતુ પોતાની પ્રજ્ઞા એટલે કે આંતરિક શક્તિથી આસપાસની દુનિયા ‘જોઈ’ શકે છે. આવી વ્યક્તિની અંદર કુદરત કંઈક એવી શક્તિ મૂકે છે જેને કારણે તે પોતાને જે દેખાતું નથી એની પણ સમજ મેળવી શકે છે.

તમને જાણીને કદાચ નવાઈ લાગશે કે આપણને ઇન્ટરનેટની જુદી જુદી વેબસાઇટ્સ બતાવતાં જુદાં જુદાં બ્રાઉઝર્સ પણ એક અર્થમાં હવે ‘પ્રજ્ઞાચક્ષુ’ બની રહ્યાં છે!

કોઈ પણ વેબ પેજ પર પહોંચતાં તેના પરની વિવિધ ઇમેજિસ આપણને જેવી દેખાય છે તેવી બ્રાઉઝરને દેખાતી હોતી નથી. તેને તો જો વેબ ડેવલપરે એ ઇમેજમાં શું છે તે દર્શાવતી માહિતી આપી હોય એ જ દેખાય છે.

આખી વાતમાં રસપ્રદ વળાંક અહીંથી જ આવે છે.

આ ઇમેજનું મશીનથી જનરેટ થયેલું વર્ણનઃ “Appears to be: Fruits and vegetables at the market.” એટલે કે ‘‘જણાય છે કેઃ બજારમાં ફળો અને શાકભાજીઓ.’’

તમે જાણતા હશો કે અપૂરતી દૃષ્ટિ કે દૃષ્ટિનો સદંતર અભાવ ધરાવતી વ્યક્તિ પણ ઇન્ટરનેટનો ઉપયોગ કરતી હોય છે. તેમને સ્ક્રીન રીડર્સ જેવી સુવિધા ઉપયોગી થતી હોય છે. તમે કદાચ એ પણ જાણતા હશો કે લગભગ બધી જ સરકારી વેબસાઇટ્સ પર સ્ક્રીન રીડરની સુવિધા આપવી વેબ ડેવલપર માટે ફરજિયાત હોય છે, જેથી દિવ્યાંગ વ્યક્તિઓ પણ તેનો પૂરતો લાભ લઈ શકે.

ઇન્ટરનેટ પર જ્યારે કોઈ વ્યક્તિ આવા સ્ક્રીન રીડરની મદદથી કોઈ વેબપેજ ‘જોઈ’ રહી હોય ત્યારે સ્ક્રીન પરનું લખાણ સ્ક્રીન રીડર સોફ્ટવેર એ વ્યક્તિને વાંચી સંભળાવે છે. જ્યારે લખાણમાં કોઈ ઇમેજ કે વીડિયો કે ઓડિયો વગેરે ટેક્સ્ટ સિવાયનો ભાગ આવે ત્યારે સ્ક્રીન રીડર સોફ્ટવેર, એ મીડિયા માટે વેબડેવલપરે જે ડેટા આપ્યો હોય તે વાંચી સંભળાવે છે.

ટેકનિકલ ભાષામાં આવા ડેટાને ‘ઓલ્ટ ટેક્સ્ટ’ અથવા ‘ઓલ્ટ એટ્રિબ્યુટ્સ’ કહેવામાં આવે છે. પરંતુ તકલીફ ત્યારે થાય છે જ્યારે વેબ ડેવલપરે પૂરતી કાળજી લઈને વેબપેજમાં મૂકેલા દરેક મીડિયા માટે યોગ્ય રીતે ઓલ્ટ ટેકસ્ટ મૂકી ન હોય.

આથી સ્ક્રીન રીડર એવી કોઈ ઇમેજ પાસે પહોંચે જેની યોગ્ય ઓલ્ટ ટેક્સ્ટ ન હોય ત્યારે તે એ ઇમેજ માટે ‘ઇમેજ’ અથવા ‘અનલેબલ્ડ ગ્રાફિક’ જેવું કંઈક બોલે છે અથવા પછી ઇમેજનું લાંબું લચક ફાઇલનેમ વાંચી સંભળાવે છે. જે સાંભળવાથી પ્રજ્ઞાચક્ષુ વ્યક્તિને એ ઇમેજ વિશે કોઈ સમજ મળતી નથી!


ઇન્ટરનેટ પર લાખો કરોડો ઇમેજિસ એવી છે, જેના માટે ઓલ્ટ ટેકસ્ટ રૂપે યોગ્ય સમજ આપવામાં આવી નથી. નિષ્ણાતોએ આ સ્થિતિનો ઉપાય પણ શોધી કાઢ્યો છે.

ઇન્ટરનેટ પર આવી તો લાખો કરોડો ઇમેજિસ છે, જેના માટે ઓલ્ટ ટેકસ્ટ રૂપે યોગ્ય સમજ આપવામાં આવી નથી.

ટેકનોલોજીના નિષ્ણાતોએ આ સ્થિતિનો ઉપાય પણ શોધી કાઢ્યો છે. હવે પછી જ્યારે કોઈ પ્રજ્ઞાચક્ષુ વ્યક્તિ ગૂગલ ક્રોમ બ્રાઉઝરમાં સ્ક્રીન રીડર સુવિધાનો ઉપયોગ કરી રહી હોય અને એ દરમિયાન બ્રાઉઝરને કોઈ વેબપેજ પર એવી ઇમેજ કે ગ્રાફિક મળે જેનું સ્પષ્ટ વર્ણન આપવામાં આવ્યું ન હોય તો ક્રોમ બ્રાઉઝર પોતાની રીતે એ ઇમેજનું વર્ણન ઉમેરી આપે છે!

આ ઇમેજનું મશીનથી જનરેટ થયેલું વર્ણનઃ “Appears to be: Person playing guitar on the sofa.” એટલે કે ‘‘જણાય છે કેઃ સોફા પર ગિટાર વગાડી રહેલી વ્યક્તિ.’’

ગૂગલ સ્પષ્ટતા કરે છે કે કમ્પ્યુટર દ્વારા ઓટોમેટિક રીતે જનરેટ કરવામાં આવતું ઇમેજનું વર્ણન કોઈ જીવતા જાગતા માણસે આપેલા વર્ણન કે સંદર્ભ જેટલું સચોટ ન હોઈ શકે, પરંતુ હાલના અભ્યાસો બતાવે છે કે કમ્પ્યુટર ખાસ્સી સચોટ રીતે અને પ્રજ્ઞાચક્ષુ વ્યક્તિને મદદરૂપ થઈ શકે એવી રીતે ઇમેજનું વર્ણન કરી આપે છે.

જ્યારે સ્ક્રીન રીડરનો ઉપયોગ કરતી વ્યક્તિ ક્રોમના સેટિંગ્સમાં જઇને ઇમેજનું ઓટોમેટિક ડિસ્ક્રિપ્શન કરવામાં આવે એવું સેટિંગ પસંદ કરે તો અને ત્યારે જ ક્રોમમાંની વર્ણન વગરની ઇમેજ સલામત રીતે ગૂગલના સર્વર પર મોકલવામાં આવે છે.

અહીં વિવિધ પ્રકારનાં મશીન લર્નિંગ મોડેલ્સની મદદથી એ ઇમેજની શક્ય એટલી માહિતી મેળવવાનો પ્રયાસ કરવામાં આવે છે. જેમ કે ઇમેજમાં કોઈ સ્પષ્ટ લખાણ દેખાઈ રહ્યું હોય, લેબલ હોય, કે હાથેથી લખેલા શબ્દો હોય તો એ ઓળખવાનો પ્રયાસ થાય છે. અન્ય મશીન લર્નિંગ મોડેલ્સથી ઇમેજમાં દેખાઈ રહેલી વિવિધ ચીજવસ્તુ ઓળખવાનો પ્રયાસ થાય છે. (એટલે જ, ગૂગલ ફોટોઝમાં આપણે કોઈ માહિતી આપી હોય તો પણ એપ જુદી જુદી ચીજવસ્તુ કે વ્યક્તિ, ઇમારતના ફોટા ઓળખી લે છે).

મજા એ વાતની છે કે જ્યારે કમ્પ્યુટરની સિસ્ટમને પૂરો વિશ્વાસ હોય કે ઇમેજનું આપોઆપ તૈયાર થયેલું વર્ણન સાચું છે ત્યારે જ તે ઇમેજમાં ઉમેરવામાં આવે છે.

છેવટે આ બધાનો તાળો મેળવીને એક સળંગ વાક્ય સ્વરૂપે એ ઇમેજમાં શું છે તે લખવામાં આવે છે!

વાત આટલેથી પૂરી થતી નથી. આટલું થયા પછી જે ઓટોમેટિક રીતે જે વાક્ય તૈયાર થયું છે એ કેટલું સચોટ છે, તે ઇમેજનું બરાબર વર્ણન કરે છે કે કેમ, આ વર્ણન ઉપયોગી છે કે કેમ વગેરે બાબતો ફરીથી મશીન લર્નિંગ સિસ્ટમમાં ફીડ કરવામાં આવે છે અને તેને આધારે ઇમેજના વર્ણનને વધુ સચોટ બનાવવાનો પ્રયાસ થાય છે.

મજા એ વાતની છે કે જ્યારે કમ્પ્યુટરની સિસ્ટમને પૂરો વિશ્વાસ હોય કે ઇમેજનું વર્ણન સાચું છે ત્યારે જ ઇમેજમાં ઉમેરવામાં આવે છે.

આ ટેકનોલોજીની મદદથી જેનું કોઈ વર્ણન આપવામાં આવ્યું ન હોય એવી ઇમેજ વિશે ઓટોમેટિકલી – બરાબર ધ્યાન આપજો – આપોઆપ એ ઇમેજનું વર્ણન કરતાં કેવાં વાક્યો તૈયાર થાય છે તેના ઉદાહરણ આ લેખ સાથેની ઇમેજમાં જોઈ લો!


Leave a Reply

Your email address will not be published. Required fields are marked *

Pleases don`t copy text!

આપને મળેલા યૂઝરનેમ-પાસવર્ડથી લોગ-ઇન થાઓ. યૂઝરનેમ તરીકે, આપે આપેલા ઈ-મેઇલનો પણ ઉપયોગ કરી શકાય છે.

[wp_eMember_fancy_login style=”8″ display_account_details=”1″]

આપનો પાસવર્ડ ભૂલાઈ ગયો છે? આપે ‘સાયબરસફર’ને આપેલું ઈ-મેઇલ એડ્રેસ આપી, ઈ-મેઇલ દ્વારા નવો પાસવર્ડ મેળવો. તેનાથી અહીં લોગ-ઇન થઈ, આપને યાદ રહે તેવો નવો પાસવર્ડ સેટ કરી શકો છો.

[wp_eMember_password_reset]

લોગ્ડ-ઇન હો ત્યારે અહીંથી આપનો પાસવર્ડ બદલી શકાય છે.

[wp_eMember_edit_profile]

આપ લોગ્ડ-ઇન હો ત્યારે વિવિધ લેખના પેજ પરથી તેને બુકમાર્ક કરી શકો છો. અહીં તેની યાદી જોવા મળશે.

[wp_eMember_user_bookmarks]

વેબસાઇટમાં ફેરફાર કરવામાં આવી રહ્યા છે. થોડો સમય અગવડતા બદલ માફ કરશો!