点阵汉字的字模读取与显示

点阵汉字的字模读取与显⽰
⽬录
⼀、汉字编码
在国标GD2312-80中规定,所有的国标汉字及符号分配在⼀个94⾏、94列的⽅阵中,⽅阵的每⼀⾏称为⼀个"区”,编号为01区到94区,每⼀列称为⼀个“位”,编号为01位到94位,⽅阵中的每⼀个汉字和符号所在的区号和位号组合在⼀起形成的四个阿拉伯数字就是它们的“区位码”。区位码的前两位是它的区号,后两位是它的位号。⽤区位码就可以唯⼀地确定⼀个汉字或符号,反过来说,任何⼀个汉字或符号也都对应着⼀个唯⼀的区位码。汉字“母”字的区位码是3624,表明它在⽅阵的36区24位,问号“?”的区位码为0331,则它在03区31位。
汉字的机内码是指在计算机中表⽰⼀个汉字的编码。机内码与区位码稍有区别。如上所述,汉字区位码的区码和位码的取值均在1~94之间,如直接⽤区位码作为机内码,就会与基本ASCIl码混淆。为了避免机内码与基本ASCII码的冲突,需要避开基本ASCIl码中的控制码(00H~1FH),还需与基本ASCII码中的
字符相区别。为了实现这两点,可以先在区码和位码分别加上20H,在此基础上再加80H(此
处“H”表⽰前两位数字为⼗六进制数)。经过这些处理,⽤机内码表⽰⼀个汉字需要占两个字节,分别称为⾼位字节和低位字节,这两位字节的机内码按如下规则表⽰:
⾼位字节 = 区码+ 20H + 80H(或区码+ A0H)
低位字节 = 位码+ 20H + 80H(或位码+ A0H)
由于汉字的区码与位码的取值范围的⼗六进制数均为01H ~ 5EH(即⼗进制的01~94),所以汉字的⾼位字节与低位字节的取值范围则为
A1H~FEH(即⼗进制的161~254)。
例如,汉字“啊”的区位码为1601,区码和位码分别⽤⼗六进制表⽰即为1001H,它的机内码的⾼位字节为BOH,低位字节为A1H,机内码就是B0A1H。
⼆、点阵字库结构
1.点阵字库存储
在汉字的点阵字库中,每个字节的每个位都代表⼀个汉字的⼀个点,每个汉字都是由⼀个矩形的点阵组成,0代表没有,1代表有点,将0和1分别⽤不同颜⾊画出,就形成了⼀个汉字,常⽤的点阵矩阵有12*12,14*14,16*16三种字库。
字库根据字节所表⽰点的不同有分为横向矩阵和纵向矩阵,⽬前多数的字库都是横向矩阵的存储⽅式(⽤得最多的应该是早期UCDOS字库),纵向矩阵⼀般是因为有某些液晶是采⽤纵向扫描显⽰法,为了提⾼显⽰速度,于是便把字库矩阵做成纵向,省得在显⽰时还要做矩阵转换。我们接下去所描述的都是指横向矩阵字库。
2. 16*16点阵字库
对于16*16的矩阵来说,它所需要的位数共是16*16=256个位,每个字节为8位,因此,每个汉字都需要⽤256/8=32个字节来表⽰。即每两个字节代表⼀⾏的16个点,共需要16⾏,显⽰汉字时,只需⼀次性读取32个字节,并将每两个字节为⼀⾏打印出来,即可形成⼀个汉字。
3. 14*14与12*12点阵字库
对于14*14和12*12的字库,理论上计算,它们所需要的点阵分别为(14*14/8)=25,(12*12/8)=18个字节,但是,如果按这种⽅式来存储,那么取点阵和显⽰时,由于它们每⼀⾏都不是8的整位数,因此,就会涉到点阵的计算处理问题,会增加程序的复杂度,降低程序的效率。
为了解决这个问题,有些点阵字库会将14*14和12*12的字库按16*14和16*12来存储,即,每⾏还是按两个字节来存储,但是14*14的字库,每两个字节的最后两位是没有使⽤,12*12的字节,每两字节的最后4位是没有使⽤,这个根据不同的字库会有不同的处理⽅式,所以在使⽤字库时要注意这个问题,特别是14*14的字库。
三、汉字点阵获取
1.利⽤区位码获取汉字
汉字点阵字库是根据区位码的顺序进⾏存储的,因此,我们可以根据区位来获取⼀个字库的点阵,它的计算公式如下:点阵起始位置 =((区码-1)*94+ (位码-1))*汉字点阵字节数
获取点阵起始位置后,我们就可以从这个位置开始,读取出⼀个汉字的点阵。
2.利⽤汉字机内码获取汉字
爱的旅程全文阅读前⾯我们⼰经讲过,汉字的区位码和机内码的关系如下:
机内码⾼位字节 = 区码+ 20H + 80H(或区码+ A0H)
机内码低位字节 = 位码+ 20H + 80H(或位码+ AOH)
反过来说,我们也可以根据机内码来获得区位码:
区码 = 机内码⾼位字节-A0H
位码 = 机内码低位字节-A0H
将这个公式与获取汉字点阵的公式进⾏合并计就可以得到汉字的点阵位置。
四、实现
打开Ubuntu,将准备好的图⽚,⽂件,HZKf2424.hz和Asi0816.zf⽂件放⼊同⼀⽂件夹下
注:⽂件保存时,编码⽅式⼀定要选ANSI格式,否则⽂字叠加在图⽚上会乱码。
打开终端,编写以下代码:
name.cpp
#include <iostream>
#include <string.h>
#include <opencv/cv.h>
#include <opencv/cxcore.h>
#include <opencv/highgui.h>
#include <opencv2/opencv.hpp>
#include <math.h>
using namespace cv;
using namespace std;
void PaintSChinese(Mat& image, int x_offset, int y_offset, unsigned long offset);
void PaintSAscii(Mat& image,int x_offset, int y_offset, unsigned long offset);
void putTextToImage(int x_offset,int y_offset,string imagePath ,char* txtPath)
{
//通过图⽚路径获取图⽚
Mat img = imread(imagePath);
Mat img = imread(imagePath);
unsigned char qh, wh;
unsigned long offset;
//⽤于存放从记事本读取的⼗六进制
char hexcode[30];
//打开包含名字的txt⽂件,转为⼗六进制,存⼊hexcode中
FILE* filetxt;
if ((filetxt = fopen(txtPath, "rb")) == NULL){
printf("Can't open txtfile,Please check the path!");
//getch();
exit(0);
}
fseek(filetxt, 0, SEEK_SET);    /*将⽂件指针移动到偏移量的位置*/
fread(hexcode, 19, 1, filetxt);
int x = x_offset, y = y_offset;//x,y:在图⽚上绘⽂字的起始的坐标
for (int m = 0; m < 19; )
if (hexcode[m] == 0x23)                /* 当读取到‘#’号时结束 */
break;
//判断⾼阶两个⼗六进制数,⼤于或等于b0(汉字第⼀个是b0a1)的都应该从汉字字库中
else if (hexcode[m] > 0xffffffaf)
{
qh = hexcode[m] - 0xaf;      /*计算区码*/
wh = hexcode[m+1] - 0xa0;      /*计算位码*/
offset = (94 * (qh - 1) + (wh - 1)) * 72L;/*计算该汉字在字库中偏移量*/
PaintSChinese(img, x , y , offset);
m = m + 2;                              //⼀个汉字占两个char,所以加2
x += 24;      //⼀个汉字在图⽚上占24个像素点,所以⽔平坐标每次+24
}
else
{
wh = hexcode[m];
offset = wh * 16L;                  //计算其他英⽂字符的偏移量
PaintSAscii(img, x, y, offset);
m++;                                //⼀个char
//原本应该8*16,但是和24*24⽐⼩了点,所以改为16*32,原本的⼀个像素点现在⽤四个像素点绘画  x += 16;
}
cv::imshow("image",img);
cv::waitKey();
}
void PaintSChinese(Mat& image, int x_offset, int y_offset, unsigned long offset){
//实际在图⽚上绘制的像素点坐标
Point p;
p.x = x_offset;
p.y = y_offset;
//打开hzk24汉字库⽂件
FILE *HZK;
char buff[72];            //存放汉字字膜
if ((HZK = fopen("HZKf2424.hz", "rb")) == NULL){
printf("Can't open HZKf2424.hz,Please check the path!");
//getch();
exit(0);
}
门事件fseek(HZK, offset, SEEK_SET);    /*将⽂件指针移动到偏移量的位置*/
fread(buff, 72, 1, HZK);    /*从偏移量的位置读取72个字节,每个汉字占72个字节*/
bool mat[24][24];                        /*定义⼀个新的矩阵存放转置后的⽂字字膜 */
int i, j, k;
//转置汉字字膜矩阵,因为汉字字膜存储的是装置后的数据(反的)
nespfor (i = 0; i<24; i++)                /*24x24点阵汉字,⼀共有24⾏*/
{
for (j = 0; j<3; j++)                /*横向有3个字节,循环判断每个字节的*/
for (k = 0; k<8; k++)              /*每个字节有8位,循环判断每位是否为1*/
if (buff[i * 3 + j] & (0x80 >> k))    /*测试当前位是否为1*/
{
mat[j * 8 + k][i] = true;          /*为1的存⼊新的字膜中*/
}
}
else {
模型仿真
mat[j * 8 + k][i] = false;
}
}
for (i = 0; i < 24; i++)
{
p.x = x_offset;
for (j = 0; j < 24; j++)
{
if (mat[i][j])
circle(image, p, 1, Scalar(255, 0, 0), -1);    //写(替换)像素点
p.x++;                                                //右移⼀个像素点
}
p.y++;                                                    //下移⼀个像素点
}
}
void PaintSAscii(Mat& image, int x_offset, int y_offset, unsigned long offset){
//绘制的起点坐标
Point p;
p.x = x_offset;
p.y = y_offset;
//存放ascii字膜中医美容论文
char buff[16];
//打开ascii字库⽂件
FILE *ASCII;
if ((ASCII = fopen("Asci0816.zf", "rb")) == NULL){
printf("Can't open Asci0816.zf,Please check the path!");
//getch();
exit(0);
}
fseek(ASCII, offset, SEEK_SET);
fread(buff, 16, 1, ASCII);
int i, j;
Point p1 = p;
for (i = 0; i<16; i++)                  //⼗六个char
{
p.x = x_offset;
for (j = 0; j < 8; j++)              //⼀个char⼋个bit
{
p1 = p;
rs
if (buff[i] & (0x80 >> j))    /*测试当前位是否为1*/
{
circle(image, p1, 0, Scalar(0, 0, 255), -1);
p1.x++;
circle(image, p1, 0, Scalar(0, 0, 255), -1);
p1.y++;
circle(image, p1, 0, Scalar(0, 0, 255), -1);
p1.x--;
circle(image, p1, 0, Scalar(0, 0, 255), -1);
}
p.x+=2;            //原来的⼀个像素点变为四个像素点,所以x和y都应该+2
}
p.y+=2;
}
}
int main(){
//参数分别为:描绘时x和y轴的偏移量、图⽚路径、所添加的⽂字(记事本⽂件)路径 putTextToImage(110,50,"lena.jpg","");
putTextToImage(110,50,"lena.jpg","");
return 0;
}
五、运⾏结果
编译运⾏,结果如下:
六、总结
通过此次作业,让我对汉字编码有了了解,知道了什么是区位码,机位码,也让我学会了点阵字库的结构,如何⽤区位码,机位码获取汉字。总体来说还是⽐较简单的,但还是在处理图⽚上叠加姓名和学号乱码的问题上卡了很久,好在最后通过查阅资料顺利解决。
七、参考资料

本文发布于:2024-09-22 14:41:06,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/239160.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:字节   点阵   区位码   机内码   矩阵   像素点
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议