ಇದೊಂದು ತಾಂತ್ರಿಕ ಮಾಹಿತಿ ಗೊತ್ತಿದ್ದರೆ ಅನುಕೂಲ, ಆಸ್ಕಿ ಮತ್ತು ಯುನಿಕೋಡ್‌ ನಡುವಿನ ವ್ಯತ್ಯಾಸವೇನು? ಮಧು ವೈಎನ್ ಬರಹ
ಕನ್ನಡ ಸುದ್ದಿ  /  ಕರ್ನಾಟಕ  /  ಇದೊಂದು ತಾಂತ್ರಿಕ ಮಾಹಿತಿ ಗೊತ್ತಿದ್ದರೆ ಅನುಕೂಲ, ಆಸ್ಕಿ ಮತ್ತು ಯುನಿಕೋಡ್‌ ನಡುವಿನ ವ್ಯತ್ಯಾಸವೇನು? ಮಧು ವೈಎನ್ ಬರಹ

ಇದೊಂದು ತಾಂತ್ರಿಕ ಮಾಹಿತಿ ಗೊತ್ತಿದ್ದರೆ ಅನುಕೂಲ, ಆಸ್ಕಿ ಮತ್ತು ಯುನಿಕೋಡ್‌ ನಡುವಿನ ವ್ಯತ್ಯಾಸವೇನು? ಮಧು ವೈಎನ್ ಬರಹ

ಆಸ್ಕಿ ಮತ್ತು ಯುನಿಕೋಡ್‌ ನಡುವಿನ ವ್ಯತ್ಯಾಸ ಏನು ಎಂಬುದರ ಕುರಿತು ಮಧು ವೈಎನ್ ಎನ್ನುವವರು ತಮ್ಮ ಫೇಸ್​ಬುಕ್​ನಲ್ಲಿ ಪೋಸ್ಟ್ ಹಂಚಿಕೊಂಡಿದ್ದು, ಕನ್ನಡಿಗರಿಗೆ ಇದೊಂದು ತಾಂತ್ರಿಕ ಮಾಹಿತಿ ಗೊತ್ತಿದ್ದರೆ ಅನುಕೂಲವಾಗಲಿದೆ ಎಂದು ತಿಳಿಸಿದ್ದಾರೆ.

ಇದೊಂದು ತಾಂತ್ರಿಕ ಮಾಹಿತಿ ಗೊತ್ತಿದ್ದರೆ ಅನುಕೂಲ, ಆಸ್ಕಿ ಮತ್ತು ಯುನಿಕೋಡ್‌ ನಡುವಿನ ವ್ಯತ್ಯಾಸವೇನು? ಮಧು ವೈಎನ್ ಬರಹ
ಇದೊಂದು ತಾಂತ್ರಿಕ ಮಾಹಿತಿ ಗೊತ್ತಿದ್ದರೆ ಅನುಕೂಲ, ಆಸ್ಕಿ ಮತ್ತು ಯುನಿಕೋಡ್‌ ನಡುವಿನ ವ್ಯತ್ಯಾಸವೇನು? ಮಧು ವೈಎನ್ ಬರಹ

ಒಂದಾನೊಂದು ಕಾಲದಲ್ಲಿ(1960s) ಕಂಪ್ಯೂಟರ್ ಮೊದಲ ಸಲ ಜಗತ್ತಿಗೆ ಕಾಲಿಟ್ಟಾಗ ಆಗಿನ್ನೂ ಅದು ಎಳಸು ಇದ್ದು ಆಗಿನ ಅಗತ್ಯ ಅದಕ್ಕೆ ಕೇವಲ ಇಂಗ್ಲೀಷನ್ನು ಮಾತ್ರ ಅರ್ಥ ಮಾಡಿಸುವುದಾಗಿದ್ದು ಮತ್ತು ಅದಕ್ಕೆ ಕೇವಲ ಒಂದು-ಸೊನ್ನೆ (ಬಿಟ್) ಅರ್ಥವಾಗುತ್ತಿದ್ದರಿಂದ ಇಂಗ್ಲೀಷನ್ನು ಬಿಟ್‌ಗೆ ಭಾಷಾಂತರ ಮಾಡುವ ಅನಿವಾರ್ಯತೆ ಸೃಷ್ಟಿಯಾಗಿತ್ತು. ಅದಕ್ಕಾಗಿ 7 ಬಿಟ್‌ಗಳನ್ನು ನಿಗದಿ ಮಾಡಲಾಯಿತು. ಆಗಿನ ಕಂಪ್ಯೂಟರಿನ ಶಕ್ತಿ ಎಂಟು ಬಿಟ್‌ಗಳಾಗಿದ್ದು ಎಂಟನೆಯ ಬಿಟ್‌ಅನ್ನು ಎರರ್‌ ಚೆಕಿಂಗಿಗೆ ಎತ್ತಿಡಲಾಗಿತ್ತು. (ಗಮನಿಸಿ: ನಮ್ಮ ಈಗಿನ ಕಂಪ್ಯೂಟರ್ಸ್ 64 ಬಿಟ್‌ ಶಕ್ತಿಶಾಲಿಯಾಗಿವೆ).

ಮನುಷ್ಯನ ಸಂಖ್ಯಾಶಾಸ್ತ್ರದಲ್ಲಿ 0-9 ಅಂದರೆ ಒಟ್ಟು 10 ಸಂಖ್ಯೆಗಳು ಇದಾವೆ. ಇದಕ್ಕಿಂತ ಜಾಸ್ತಿ ಬೇಕಂದರೆ ಎರಡು ಸಂಖ್ಯೆಗಳನ್ನು ಅಕ್ಕಪಕ್ಕ ಜೋಡಿಸಿಬೇಕು. ಹಾಗೆ ಮಾಡಿದಾಗ ನಮಗೆ 00-99 ಅಂದರೆ ಒಟ್ಟು ನೂರು ಸಂಖ್ಯೆಗಳು ಸಿಗುತ್ತವೆ. ಅದೇ ರೀತಿ 7 ಬಿಟ್‌ಗಳನ್ನು ಅಕ್ಕಪಕ್ಕ ಜೋಡಿಸಿದಾಗ ನಮಗೆ 128 ಸಂಖ್ಯೆಗಳು ಅಥವಾ ಕೋಡ್‌ಗಳು ದೊರೆಯುತ್ತವೆ. ಇಂಗ್ಲೀಷಿನ A-Z, a-z, 0-9, . , ? ! @ # ಹಾಳುಮೂಳು ಸೇರಿ ಒಟ್ಟು ನೂರಿಪ್ಪತ್ತೆಂಟು ಮನುಷ್ಯ ಭಾಷೆಯ ಚಿನ್ಹೆಗಳನ್ನು ನೂರಿಪ್ಪತ್ತೆಂಟು ಕೋಡ್‌ಗಳಿಗೆ ನಿಗದಿ ಮಾಡಿ ಮೊದಲ ಸಲ ಮನುಷ್ಯ ಭಾಷೆಯನ್ನು ಕಂಪ್ಯೂಟರಿಗೆ ಭಾಷಾಂತರಿಸಿ ಅರ್ಥ ಮಾಡಿಸಲಾಯಿತು. ಇದೇ ಮತ್ತು ಇಷ್ಟೇ ಆಸ್ಕಿ ಕೋಡ್. ಉದಾಹರಣೆಗೆ ಇಂಗ್ಲೀಷಿನ ಅಕ್ಷರ A ಗೆ ನಿಗದಿಯಾಗಿರುವುದು 65ನೇ ಆಸ್ಕಿ ಕೋಡ್‌ (01000001).

ಸರಿ ಇರುವ 128 ಸಂಖ್ಯೆಗಳನ್ನು ಬರೀ ಇಂಗ್ಲೀಷಿಗೆ ಖರ್ಚು ಮಾಡಿಬಿಟ್ಟರೆ ಉಳಿದ ಭಾಷೆಗಳು ಏನು ಮಾಡಬೇಕು? ಹೊಸ ಕೋಡ್‌ಗಳು ಬೇಕು. ಅಂದರೆ ಇನ್ನಷ್ಟು ಒಂದು-ಸೊನ್ನೆಗಳನ್ನು ಬಳಸಬೇಕು. ಹೀಗೆ ಯೋಚಿಸಿದಾಗ ಹುಟ್ಟಿದ್ದೇ ಯೂನಿವರ್ಸಲ್‌ ಕ್ಯಾರಕ್ಟರ್‌ ಎಂಕೋಡಿಂಗ್ (ಯೂನಿಕೋಡ್).‌

ಯುನಿಕೋಡ್‌ನಿಂದ ಗಜಿಬಿಜಿ

ನಮ್ಮಲ್ಲಿ ಮೂರು ಸಂಖ್ಯೆಗಳನ್ನು ಅಕ್ಕಪಕ್ಕ ಇಟ್ಟರೆ 000-999 ಒಟ್ಟು ಸಾವಿರ ಸಂಖ್ಯೆಗಳು ಸಿಗುತ್ತವಲ್ವ ಹಾಗೆ ಯುನಿಕೋಡಿನಲ್ಲಿ ಎಂಟರ ಬದಲಾಗಿ ಹದಿನಾರು ಬಿಟ್‌ಗಳನ್ನು ಎತ್ತಿಟ್ಟರು. ಇದರಿಂದಾಗಿ ಏಕ್ದಂ 65 ಸಾವಿರ ಹೊಸ ಕೋಡ್‌ಗಳು ಸಿಕ್ಕಂತಾಯಿತು. ಯಾವುದಕ್ಕೂ ಇರಲಿ ಎಂದು ಹೆಚ್ಚುವರಿಯಾಗಿ ಇನ್ನು ಹದಿನಾರು ಬಿಟ್‌ ಎತ್ತಿಟ್ಟಿದ್ದರು. ಮೊದಲ ಹದಿನಾರು ಬಿಟ್‌ ಬಳಸಿಕೊಂಡು ಪ್ರತಿ ಭಾಷೆಯ ಪ್ರತಿ ಅಕ್ಷರಕ್ಕೆ ಹೊಸ ಕೋಡ್‌ ಕೊಡುತ್ತಾ ಹೋದರು. ಆಗ ಏನಾಯಿತೆಂದರೆ ಅಲ್ಲಿ ತನಕ ಆಸ್ಕಿ ಬಳಸುತ್ತಿದ್ದವರೆಲ್ಲ ನಿಮ್ಮ ಯುನಿಕೋಡ್‌ನಿಂದಾಗಿ ನಮ್ಮ ಹಳೆಯ ಬರಹವೆಲ್ಲಾ ಗಜಿಬಿಜಿಯಾಗುತ್ತಿದೆ ಎಂದು ಬಾಯಿ ಬಡಿದುಕೊಂಡರು.

ತಂತ್ರಜ್ಞರು ‘ಅರರೆ ನಮ್ಮ ಪೂರ್ವಿಕರ ಕಷ್ಟವನ್ನೂ ಆಲಿಸಬೇಕಲ್ಲಾ’ ಎಂದು ಮನಸು ಬದಲಾಯಿಸಿ ಯುನಿಕೋಡಿನ ಮೊದಲ 128 ಕೋಡುಗಳನ್ನು ಮೂಲ ಆಸ್ಕಿಯಲ್ಲಿದ್ದಂತೆಯೇ ಇಂಗ್ಲೀಷಿಗೆ ನಿಗದಿ ಮಾಡಿದರು. ಮೊದಲು ತಂದದ್ದು UTF-16 ಎಂದು ಕರೆದರು. ಆಸ್ಕಿ ಗೋಳಾಟಕ್ಕಾಗಿ ತಿದ್ದುಪಡಿ ಮಾಡಿದ್ದನ್ನು UTF-8 ಎಂದು ಕರೆದರು. ಆದ್ದರಿಂದಲೇ ಗಮನಿಸಿದ್ದಲ್ಲಿ ನಿಮ್ಮ ವರ್ಡ್‌ ಫೈಲಿನಲ್ಲಿ ಆಸ್ಕಿಯಿಂದ ಯೂನಿಕೋಡಿಗೆ ಅಥವಾ ಯುನಿಕೋಡಿಂದ ಆಸ್ಕಿಗೆ ಬದಲಾಯಿಸಿದಾಗ ಕನ್ನಡ ಅಕ್ಷರಗಳು ಗಜಿಬಿಜಿಯಾಗುತ್ತವೇ ವಿನಾ ಇಂಗ್ಲೀಷಿನದು ಅಲ್ಲ. ಇದು ಯಾಕಂದರೆ ಡೀಫಾಲ್ಟ್‌ ಯೂನಿಕೋಡ್‌ UTF-8 ಸೆಟ್‌ ಆಗಿರುತ್ತದೆ.

ಇದರ ನಂತರ ಇನ್ನೂ ಒಂದು ಹೊಸ ಸಮಸ್ಯೆ ಹುಟ್ಟಿಕೊಂಡಿತು. ಆಗಲೇ ಹೇಳಿದಂತೆ ಮೂರು ಸಂಖ್ಯೆಗಳನ್ನು ಜೋಡಿಸಿದರೆ ಒಟ್ಟು ಸಾವಿರ ಸಂಖ್ಯೆಗಳು ಸಿಗುತ್ತವೆ ಎಂದೆನಲ್ಲಾ ಅದರಲ್ಲಿ ನೀವು 99 ಸಂಖ್ಯೆಯನ್ನು 099 ಎಂದು ಬರೆಯೋದಿಲ್ಲ ಅಲ್ಲವಾ? UTF-8ನಲ್ಲಿಯೂ ಹಾಗೇ ಆರಂಭದಲ್ಲಿ ಬರುವ ಇಂಗ್ಲೀಷಿನ ಅಕ್ಷರಗಳನ್ನು 8 ಬಿಟ್‌ಗಳಲ್ಲಿ ಬರೆದು ಮುಗಿಸಿಬಿಡುತ್ತಿದ್ದರು. ಕನ್ನಡದಂಥ ಅಕ್ಷರಗಳಿಗೆ ಮಾತ್ರ ಹೆಚ್ಚಿನ ಬಿಟ್‌ಗಳನ್ನು ಬಳಸುತ್ತಿದ್ದರು. ಕಂಪ್ಯೂಟರಿನ ಕೆಲವು ಕಡೆ ಇದು ತೊಂದರೆ ಕೊಡಲಾರಂಭಿಸಿತು. ಅಂದ್ರೆ 999 ಎಂಬುದನ್ನು 9 ಮತ್ತು 99 ಎಂದೂ ಓದಬಹುದಲ್ಲ, ಅಂತಹ ಗೊಂದಲ. ಆದ್ದರಿಂದ ಎಲ್ಲಾ ಅಕ್ಷರಗಳಿಗೂ ಕಡ್ಡಾಯವಾಗಿ 32 ಒಂದು-ಸೊನ್ನೆಗಳನ್ನು ಬಳಸಲೇಬೇಕು ಎಂಬ ನಿಯಮ ಹೊರಡಿಸಿದರು. ಅಂತಹ ನಿಯಮ ಹೊತ್ತ ಎಂಕೋಡಿಂಗ್‌ ಅನ್ನು UTF-32 ಎಂದು ಕರೆದರು.

ಆದರೆ ಜನ ಇದನ್ನು ಎರಡೂ ತೋಳು ಅಗಲಿಸಿ ಬಾಚಿ ತಬ್ಬಿಕೊಳ್ಳಲಿಲ್ಲ. ಯಾಕಂದರೆ ಒಂದು ಬೈಟ್‌ ಜಾಗದಲ್ಲಿ ನಾಲ್ಕು ಬೈಟ್‌ ಬಳಸಿ ಸುಮ್ಮನೇ ಮೂರು ಬೈಟ್‌ ದಂಡ ಮಾಡುವುದು ಸಮಂಜಸ ಅನ್ನಿಸಲಿಲ್ಲ. ಉದಾಹರಣೆಗೆ ಒಂದು ಮೆಗಾ ಬೈಟ್‌ ಸೈಜಿನ ವರ್ಡ್‌ ಫೈಲನ್ನು ಸುಮ್ಮ ಸುಮ್ಮನೇ ನಾಲ್ಕು ಮೆಗಾ ಬೈಟ್‌ ಸೈಜ್‌ಗೆ ಏರಿಸಿದರೆ ಇಂಟರ್ನೆಟ್‌ ಸ್ಪೀಡು ದಂಡ ಅನಿಸುವುದಿಲ್ಲವೇ? ಹಾಗಾಗಿ ಇಂದು ಜಗತ್ತಿನಾದ್ಯಂತ ಯೂನಿಕೋಡ್‌, ಅದರಲ್ಲಿಯೂ UTF-8 ಮಾತ್ರ ವ್ಯಾಪಕ ಬಳಕೆಯಲ್ಲಿದೆ. ನೀವು ಏನು ಮಾಡ್ತಿದ್ದೀರಿ ಎಂದು ನಿಮಗೆ ಗೊತ್ತಿದ್ದರೆ ಮಾತ್ರ UTF-16 ಅಥವಾ UTF-32 ಬಳಸಬಹುದಾಗಿದೆ.

ಆಸ್ಕಿ ಬಳಸುತ್ತಿದಾರೆ ಎಂಬುದು ಆಶ್ಚರ್ಯ

ಆರಂಭದಲ್ಲಿ ಹೇಳಿದಂತೆ ಕಂಪ್ಯೂಟರು ಹುಟ್ಟಿದಾಗ ಶುರುವಾತಿನಲ್ಲಿ ಆಸ್ಕಿ ವ್ಯವಸ್ಥೆ ಇತ್ತು. ಮೊಬೈಲ್‌ಗಳು ಬರುವಷ್ಟರಲ್ಲಿ ಯುನಿಕೋಡ್‌ ಬಂದಾಗಿತ್ತು. ಆದ್ದರಿಂದಲೇ ನೀವು ಬರಹ ನುಡಿ ಮುಂತಾದ್ದು ಬಳಸಿ ಆಸ್ಕಿ ಕೋಡಿನಲ್ಲಿ ಬರೆದ ಕನ್ನಡವನ್ನು ಮೊಬೈಲಿನಲ್ಲಿ ತೆರೆಯಲಾಗಲ್ಲ. ಯಾಕಂದರೆ ಮೊಬೈಲಿಗೆ ಆ ಕೋಡ್‌ವರ್ಡ್​​ಗಳು ಅರ್ಥವಾಗಲ್ಲ. ಇಷ್ಟು ಅರ್ಥವಾಗಿದ್ದಲ್ಲಿ ಅಕಸ್ಮಾತ್‌ ನಿಮ್ಮ ಕಣ್ಣಿಗೆ ‘ಅರೆ ಈ ಕನ್ನಡ ಅಕ್ಷರ ಕಂಪ್ಯೂಟರಿನಲ್ಲಿ ಇಲ್ಲವಲ್ಲಪ್ಪ’ ಅನಿಸಿದರೆ ಅಗತ್ಯವಾಗಿ ಅದನ್ನು ಯೂನಿಕೋಡ್‌ ಸಂಸ್ಥೆಯ ಗಮನಕ್ಕೆ ತರಬಹುದು. ಅವರು ಅದಕ್ಕೆ ಒಂದು ಕೋಡ್‌ ನಿಗದಿ ಮಾಡುತ್ತಾರೆ. ಆನಂತರ ಫಾಂಟ್‌ ಡೆವಲಪ್‌ ಮಾಡುವವರು ಹೊಸ ಅಕ್ಷರವನ್ನು ವಿನ್ಯಾಸ ಮಾಡಿ ನಿಗದಿಯಾಗಿರುವ ಯೂನಿಕೋಡ್‌ ಸೆಟ್‌ ಮಾಡಿ ತಮ್ಮ ಫಾಂಟಿನಲ್ಲಿ ಸೇರಿಸಬೇಕಾಗುತ್ತದೆ. (ಕನ್ನಡದ ದಿನಪತ್ರಿಕೆಗಳು ಪುಸ್ತಕ ಮುದ್ರಕರು ಇನ್ನು ಆಸ್ಕಿ ಬಳಸುತ್ತಿದಾರೆ ಎಂಬುದು ಆಶ್ಚರ್ಯ, ವಿಸ್ಮಯ, ಬೆರಗಿನ ಸಂಗತಿ).

ಗಮನಕ್ಕೆ: ಮಧು ವೈಎನ್ ಅವರ ಫೇಸ್​ಬುಕ್ ಫೋಸ್ಟ್ ಅನ್ನು ಯಥಾವತ್ತಾಗಿ ಪ್ರಕಟಿಸಲಾಗಿದೆ.

Whats_app_banner