Share
Facebook
Twitter
LinkedIn
Whatsapp
Instagram
Messenger

এইচটিএমএল অক্ষরসেট - HTML Charset


ব্রাউজার কে কোন ওয়েব পেজ সঠিকভাবে প্রদর্শনের জন্য ওয়েব পেজে ক্যারেক্টার এনকোডিং সংক্রান্ত তথ্য জানিয়ে দেয়া প্রয়োজন। টিউটোরিয়াল এর এই অংশে আমরা ক্যারেক্টার এনকোডিং সম্পর্কে বিস্তারিত আলোচনা করেছি।


ক্যারেক্টার এনকোডিং কি?

সর্বপ্রথম ক্যারেক্টার এনকোডিং স্ট্যান্ডার্ড হল ASCII, একে ক্যারেক্টার সেটও বলা হয়। ASCII তে ১২৭টি আলফা-নিউমেরিক ক্যারেক্টার আছে যা তৎকালীন সময়ে ইন্টারনেটে ব্যবহার করা হত, 0-9 পর্যন্ত ১০ টি গাণিতিক সংখ্যা, A-Z পর্যন্ত ২৬ টি ইংরেজি বর্ণমালা এবং আরও কিছু বিশেষ চিহ্ন, যেমনঃ ! , $, +, -, (, ) ,@ ,< > ইত্যাদি।

ANSI (Windows-1252) হল উইন্ডোজ ভিত্তিক অপারেটিং সিস্টেমের প্রধান ক্যারেক্টার সেট। এতে ২৫৬টি ক্যারেক্টার কোড ব্যবহার করা যায়।

এইচটিএমএল ৪.০১ এ পূর্ব-নির্ধারিত বা default ক্যারেক্টার সেট ছিল ISO-8859-1 এবং এখানেও ২৫৬টি ক্যারেক্টার কোড ব্যবহার করা যায়।

ANSI এবং ISO-8859-1 সীমিত থাকার কারণে এইচটিএমএল ৫.০ এ পূর্ব-নির্ধারিত বা default ক্যারেক্টার সেট পরিবর্তন করে UTF-8 করা হয়।

বর্তমানে পৃথিবীর প্রায় সকল ক্যারেক্টার এবং চিহ্ন UTF-8 (Unicode) এ অন্তর্ভুক্ত করা হয়েছে।

এইচটিএমএল এর ক্যারেক্টার এনকোডিং সম্পর্কে বিস্তারিত জানতে W3C এর Document Representation ওয়েব পেজটি ব্রাউজ করুন।


এইচটিএমএল charset এট্রিবিউট

ব্রাউজারের মাধ্যমে, কোন এইচটিএমএল ওয়েব পেজকে সঠিকভাবে প্রদর্শন করার জন্যে ওয়েব পেজের ক্যারেক্টার সেট সংক্রান্ত তথ্য ওয়েব ব্রাউজারকে জানিয়ে দিতে হয়। <meta> ট্যাগ ব্যাবহার করে ওয়েব ব্রাউজারকে এই তথ্য সম্পর্কে অবহিত করা হয়।

নিচে এইচটিএমএল ৪.০১ এবং এইচটিএমএল ৫.০ সংস্করণের জন্য ক্যারেক্টার সেট নির্ধারণ এর উদাহরণ দেখুন।

এইচটিএমএল ৪.০১ এর জন্য


<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

কোড এডিটর


এইচটিএমএল ৫.০ এর জন্য


<meta charset="UTF-8">

কোড এডিটর



বিভিন্ন ক্যারেক্টার সেট

নিম্নলিখিত টেবিলে ক্যারেক্টার সেটগুলোর মধ্যে পার্থক্য দেয়া হল।

নম্বর ASCII ANSI 8859 UTF-8 বর্ণনা
32 স্পেস
33!!!!বিস্ময়বোধক চিহ্ন
34""""উদ্ধৃতি চিহ্ন
35####নম্বর চিহ্ন
36$$$$ডলার চিহ্ন
37%%%%শতকরা চিহ্ন
38&&&&এম্পারসেন্ড
39''''ঊর্ধকমা
40((((বাম প্রথম বন্ধনী
41))))ডান প্রথম বন্ধনী
42****অ্যাসটেরিস্ক
43++++যোগ চিহ্ন
44,,,,কমা
45----হাইফেন-বিয়োগ
46....ফুলস্টপ
47////স্ল্যাশ
480000শূন্য
491111এক
502222দুই
513333তিন
524444চার
535555পাঁচ
546666ছয়
557777সাত
568888আট
579999নয়
58::::কোলন
59;;;;সেমিকোলন
60<<<<ক্ষুদ্রতম চিহ্ন
61====সমান চিহ্ন
62>>>>বৃহত্তর চিহ্ন
63????প্রশ্নবোধক চিহ্ন
65AAAAল্যাটিন বড় হাতের A
66BBBBল্যাটিন বড় হাতের B
67CCCCল্যাটিন বড় হাতের C
68DDDDল্যাটিন বড় হাতের D
69EEEEল্যাটিন বড় হাতের E
70FFFFল্যাটিন বড় হাতের F
71GGGGল্যাটিন বড় হাতের G
72HHHHল্যাটিন বড় হাতের H
73IIIIল্যাটিন বড় হাতের I
74JJJJল্যাটিন বড় হাতের J
75KKKKল্যাটিন বড় হাতের K
76LLLLল্যাটিন বড় হাতের L
77MMMMল্যাটিন বড় হাতের M
78NNNNল্যাটিন বড় হাতের N
79OOOOল্যাটিন বড় হাতের O
80PPPPল্যাটিন বড় হাতের P
81QQQQল্যাটিন বড় হাতের Q
82RRRRল্যাটিন বড় হাতের R
83SSSSল্যাটিন বড় হাতের S
84TTTTল্যাটিন বড় হাতের T
85UUUUল্যাটিন বড় হাতের U
86VVVVল্যাটিন বড় হাতের V
87WWWWল্যাটিন বড় হাতের W
88XXXXল্যাটিন বড় হাতের X
89YYYYল্যাটিন বড় হাতের Y
90ZZZZল্যাটিন বড় হাতের Z
91[[[[বাম স্কয়ার ব্রাকেট বা তৃতীয় বন্ধনী
92\\\\ব্যাকওয়ার্ড স্ল্যাশ
93]]]]ডান স্কয়ার ব্রাকেট বা তৃতীয় বন্ধনী
94^^^^সারকামফ্লেক্স এসেন্ট
95____আন্ডারস্কোর
96````বর্ণের উচ্চারণ নির্দেশক চিহ্ন
97aaaaল্যাটিন ছোট হাতের a
98bbbbল্যাটিন ছোট হাতের b
99ccccল্যাটিন ছোট হাতের c
100ddddল্যাটিন ছোট হাতের d
101eeeeল্যাটিন ছোট হাতের e
102ffffল্যাটিন ছোট হাতের f
103ggggল্যাটিন ছোট হাতের g
104hhhhল্যাটিন ছোট হাতের h
105iiiiল্যাটিন ছোট হাতের i
106jjjjল্যাটিন ছোট হাতের j
107kkkkল্যাটিন ছোট হাতের k
108llllল্যাটিন ছোট হাতের l
109mmmmল্যাটিন ছোট হাতের m
110nnnnল্যাটিন ছোট হাতের n
111ooooল্যাটিন ছোট হাতের o
112ppppল্যাটিন ছোট হাতের p
113qqqqল্যাটিন ছোট হাতের q
114rrrrল্যাটিন ছোট হাতের r
115ssssল্যাটিন ছোট হাতের s
116ttttল্যাটিন ছোট হাতের t
117uuuuল্যাটিন ছোট হাতের u
118vvvvল্যাটিন ছোট হাতের v
119wwwwল্যাটিন ছোট হাতের w
120xxxxল্যাটিন ছোট হাতের x
121yyyyল্যাটিন ছোট হাতের y
122zzzzল্যাটিন ছোট হাতের z
123{{{{বাম কার্লি ব্র্যাকেট বা দ্বিতীয় বন্ধনী
124||||উল্লম্ব লাইন বা পাইপ
125}}}}ডান কার্লি ব্র্যাকেট বা দ্বিতীয় বন্ধনী
126~~~~টিল্ড
127DEL    
128   ইউরো চিহ্ন
129 ব্যবহার করা হয় না
130   সিংগেল কোটেশান মার্ক
131 ƒ  ল্যাটিন ছোট হাতের f
132   ডাবল কোটেশান মার্ক
133   অনুভূমিক উপবৃত্ত
134   ডেগার
135   ডাবল ডেগার
136 ˆ  সারকামফ্লেক্স অ্যাসেন্ট
137   পারমিলি চিহ্ন
138 Š  ক্যারোনযুক্ত ল্যাটিন বড় হাতের S
139   সিংগেল লেফট অ্যাঙ্গেল কোটেশন চিহ্ন
140 Œ   ল্যাটিন বড় হাতের OE এর সংযুক্ত বর্ণ
141 ব্যবহার হয় না
142 Ž  ক্যারোনযুক্ত ল্যাটিন বড় হাতের Z
143 ব্যবহার হয় না
144 ব্যবহার হয় না
145   লেফট সিঙ্গেল উদ্ধৃতি চিহ্ন
146   রাইট সিঙ্গেল উদ্ধৃতি চিহ্ন
147   বাম ডাবল উদ্ধৃতি চিহ্ন
148   ডান ডাবল উদ্ধৃতি চিহ্ন
149   বুলেট
150   en ড্যাশ
151   em ড্যাশ
152 ˜  ছোট টিল্ড
153   ট্রেড মার্ক চিহ্ন
154 š  ক্যারোনযুক্ত ল্যাটিন ছোট হাতের s
155   সিঙ্গেল রাইট অ্যাঙ্গেল উদ্ধৃতি চিহ্ন
156 œ  ল্যাটিন ছোট হাতের oe এর সংযুক্ত বর্ণ
157 ব্যবহার করা হয় না
158 ž  ক্যারোনযুক্ত ল্যাটিন ছোট হাতের z
159 Ÿ  ডাইরেসিস যুক্ত ল্যাটিন বড় হাতে Y
160    নো-ব্রেক স্পেস
161 ¡¡¡উল্টানো বিস্ময়বোধক চিহ্ন
162 ¢¢¢সেন্ট চিহ্ন
163 £££পাউন্ড চিহ্ন
164 ¤¤¤কারেন্সি চিহ্ন
165 ¥¥¥ইয়েন চিহ্ন
166 ¦¦¦ব্রোকেন বার
167 §§§সেকশন চিহ্ন
168 ¨¨¨ডাইরেসিস
169 ©©©কপিরাইট চিহ্ন
170 ªªªফেমিনিন অর্ডিন্যাল ইন্ডিকেটর
171 «««লেফট অ্যাংগেল ডাবল কোটেশন চিহ্ন
172 ¬¬¬নট সাইন
173 ­­­সফট হাইফেন
174 ®®®রেজিস্টার চিহ্ন
175 ¯¯¯ম্যাকরন
176 °°°ডিগ্রী চিহ্ন
177 ±±±যোগ-বিয়োগ চিহ্ন
178 ²²²সুপারস্ক্রিপ্ট ২
179 ³³³সুপারস্ক্রিপ্ট ৩
180 ´´´একিউট এসেন্ট
181 µµµমাইক্রো চিহ্ন
182 পিলক্রো চিহ্ন
183 ···মাঝখানে ডট
184 ¸¸¸চিহ্নবিশেষ
185 ¹¹¹সুপারস্ক্রিপ্ট ১
186 ºººমাসকুলাইন অর্ডিন্যাল ইন্ডিকেটর
187 »»»ডানদিক নির্দেশীয় ডাবল অ্যাঙ্গেল কোটেশান চিহ্ন
188 ¼¼¼এক চতুর্থাংশ ভগ্নাংশ
189 ½½½এক দ্বিতীয়াংশ ভগ্নাংশ
190 ¾¾¾এক তৃতীয়াংশ ভগ্নাংশ
191 ¿¿¿উল্টানো প্রশ্নবোধক চিহ্ন
192 ÀÀÀগ্রেভযুক্ত ল্যাটিন বড় হাতের A
193 ÁÁÁএকিউটযুক্ত ল্যাটিন বড় হাতের A
194 ÂÂÂসারকামপ্লেক্সযুক্ত ল্যাটিন বড় হাতের A
195 ÃÃÃটিল্ডযুক্ত ল্যাটিন বড় হাতের A
196 ÄÄÄডাইরেসিস সঙ্গে ল্যাটিন বড় হাতের A
197 ÅÅÅউপরে রিংযুক্ত ল্যাটিন বড় হাতের A
198 ÆÆÆল্যাটিন বড় হাতের AE
199 ÇÇÇসেডিলাযুক্ত ল্যাটিন বড় হাতের C
200 ÈÈÈগ্রেভযুক্ত ল্যাটিন বড় হাতের E
201 ÉÉÉএকিউটযুক্ত ল্যাটিন বড় হাতের E
202 ÊÊÊসারকামপ্লেক্সযুক্ত ল্যাটিন বড় হাতের E
203 ËËËডাইরেসিসযুক্ত ল্যাটিন বড় হাতের E
204 ÌÌÌগ্রেভযুক্ত ল্যাটিন বড় হাতের I
205 ÍÍÍএকিউটযুক্ত ল্যাটিন বড় হাতের I
206 ÎÎÎসারকামপ্লেক্সযুক্ত ল্যাটিন বড় হাতের I
207 ÏÏÏডাইরেসিসযুক্ত ল্যাটিন বড় হাতের I
208 ÐÐÐ ল্যাটিন বড় হাতের Eth
209 ÑÑÑটিল্ডযুক্ত ল্যাটিন বড় হাতের N
210 ÒÒÒগ্রেভযুক্ত ল্যাটিন বড় হাতের O
211 ÓÓÓএকিউটযুক্ত ল্যাটিন বড় হাতের O
212 ÔÔÔসারকামপ্লেক্সযুক্ত ল্যাটিন বড় হাতের O
213 ÕÕÕটিল্ডযুক্ত ল্যাটিন বড় হাতের O
214 ÖÖÖডাইরেসিসযুক্ত ল্যাটিন বড় হাতের O
215 ×××গুণন চিহ্ন
216 ØØØস্ট্রোকযুক্ত ল্যাটিন বড় হাতের O
217 ÙÙÙগ্রেভযুক্ত ল্যাটিন বড় হাতের U
218 ÚÚÚএকিউটযুক্ত ল্যাটিন বড় হাতের U
219 ÛÛÛসারকামপ্লেক্সযুক্ত ল্যাটিন বড় হাতের U
220 ÜÜÜডাইরেসিসযুক্ত ল্যাটিন বড় হাতের U
221 ÝÝÝএকিউটযুক্ত ল্যাটিন বড় হাতের Y
222 ÞÞÞল্যাটিন বড় হাতের থর্ন
223 ßßßল্যাটিন ছোট হাতের সার্প s
224 àààগ্রেভযুক্ত ল্যাটিন ছোট হাতের a
225 áááএকিউটযুক্ত ল্যাটিন ছোট হাতের a
226 âââসারকামপ্লেক্সযুক্ত ল্যাটিন ছোট হাতের a
227 ãããটিল্ডযুক্ত ল্যাটিন ছোট হাতের a
228 äääডাইরেসিসযুক্ত ল্যাটিন ছোট হাতের a
229 åååউপরে রিংযুক্ত ল্যাটিন ছোট হাতের a
230 æææল্যাটিন ছোট হাতের ae
231 çççক্যাডিলাযুক্ত ল্যাটিন ছোট হাতের c
232 èèèগ্রেভযুক্ত ল্যাটিন ছোট হাতের e
233 éééএকিউটযুক্ত ল্যাটিন ছোট হাতের e
234 êêêসারকামপ্লেক্সযুক্ত ল্যাটিন ছোট হাতের e
235 ëëëডাইরেসিসযুক্ত ল্যাটিন ছোট হাতের e
236 ìììগ্রেভযুক্ত ল্যাটিন ছোট হাতের i
237 íííএকিউটযুক্ত ল্যাটিন ছোট হাতের i
238 îîîসারকামপ্লেক্সযুক্ত ল্যাটিন ছোট হাতের i
239 ïïïডাইরেসিসযুক্ত ল্যাটিন ছোট হাতের i
240 ðððল্যাটিন ছোট হাতের eth
241 ñññটিল্ডযুক্ত ল্যাটিন ছোট হাতের n
242 òòòগ্রেভযুক্ত ল্যাটিন ছোট হাতের o
243 óóóএকিউটযুক্ত ল্যাটিন ছোট হাতের o
244 ôôôসারকামপ্লেক্সযুক্ত ল্যাটিন ছোট হাতের o
245 õõõটিল্ডযুক্ত ল্যাটিন ছোট হাতের o
246 öööডাইরেসিসযুক্ত ল্যাটিন ছোট হাতের o
247 ÷÷÷বিভাজন/ভাগ চিহ্ন
248 øøøস্ট্রোকযুক্ত ল্যাটিন ছোট হাতের o
249 ùùùগ্রেভযুক্ত ল্যাটিন ছোট হাতের u
250 úúúএকিউটযুক্ত ল্যাটিন ছোট হাতের u
251 ûûûসারকামপ্লেক্সযুক্ত ল্যাটিন ছোট হাতের u
252 üüüডাইরেসিসযুক্ত ল্যাটিন ছোট হাতের u
253 ýýýএকিউটযুক্ত ছোট হাতের y
254 þþþল্যাটিন ছোট বর্ণ থর্ন
255 ÿÿÿল্যাটিন ছোট বর্ণ y সাথে ডাইরেসিস


ASCII ক্যারেক্টার সেট

ASCII ক্যারেক্টার সেট নিয়ন্ত্রণের জন্য ১২৭ সহ ০ থেকে ৩১ পর্যন্ত মানগুলো ব্যবহার করা হয়েছে।
ASCII অক্ষর, সংখ্যা এবং চিহ্নের জন্য ৩২ থেকে ১২৬ পর্যন্ত মানগুলো ব্যবহার করা হয়েছে।
ASCII ১২৮ থেকে ২৫৫ পর্যন্ত সংখ্যা গুলোকে মান বা value রুপে ব্যবহার করে না।


ANSI ক্যারেক্টার সেট(উইন্ডো-১২৫২)

ANSI সেট হল ০ থেকে ১২৭ পর্যন্ত ASCII এর মত।
ANSI ১২৮ থেকে ১৫৯ পর্যন্ত মানগুলোর জন্য একটি নিজস্ব অক্ষরসেট রয়েছে।
ANSI সেটটিতে ১৬০ থেকে ২৫৫ পর্যন্ত সংখ্যা গুলোর মান UTF-8 এর মত।


ISO-8859-1 ক্যারেক্টার সেট

8859-1 সেট এ ০ থেকে ১২৭ পর্যন্ত সংখ্যার মানগুলো ASCII এর মত।
১২৮ থেকে ১৫৯ এর মধ্যে সংখ্যার মানগুলো 8859-1 তে ব্যবহার করা হয় না।
১৬০ থেকে ২৫৫ পর্যন্ত সংখ্যার মান গুলো UTF-8 এর মত।


UTF-8 ক্যারেক্টার সেট

UTF-8 সেট এ ০ থেকে ১২৭ পর্যন্ত সংখ্যার মান গুলো ASCII এর মত।
১২৮ থেকে ১৫৯ পর্যন্ত সংখ্যার এই মান গুলো UTF-8 ব্যবহার করে না। 
১৬০ থেকে ২৫৫ পর্যন্ত সংখ্যার এই মানগুলো ANSI এবং 8859-1 এর মত।
UTF-8 এ ১০,০০০ এর বেশি ক্যারেক্টার রয়েছে যা ২৫৬ থেকে শুরু হয়।


@charset সিএসএস রুল

সিএসএস @charset রুল ব্যবহার করে সিএসএস স্টাইল সিটে ক্যারেক্টার এনকোডিং নির্ধারণ করে দেয়া যায়। নিচে এর উদাহরণ দেখুন।

উদাহরণ


@charset "UTF-8";

কোড এডিটর