以开头的是什么编码? php中文转以开头的文字
时间:2023年10月14日
/来源:网络
/编辑:佚名
中文汉字是转如何换成HTML实体的呢?
其实很简单,汉字的HTML实体由三部分组成,”&#+ASCII+;“ 即可。
例如,把“欢迎点赞收藏” 转换成“欢迎点赞收藏”
下面是php实现过程,喜欢的朋友可以点赞收藏哦
echo ascii_decode("黄瓜");
echo ascii_encode("黄瓜");
function ascii_decode($str, $prefix="&#") {
$string = '';
$str = str_replace($prefix, "", $str);
$strArr = explode(";", $str);
foreach ($strArr as $dec) {
if ($dec < 128) {
$string .= chr((int)str_replace($prefix,"",$dec));
} else if ($dec < 2048) {
$string .= chr(192 + (($dec - ($dec % 64)) / 64));
$string .= chr(128 + ($dec % 64));
} else {
$string .= chr(224 + (($dec - ($dec % 4096)) / 4096));
$string .= chr(128 + ((($dec % 4096) - ($dec % 64)) / 64));
$string .= chr(128 + ($dec % 64));
}
}
return $string;
}
function ascii_encode($str, $prefix = "&#") {
$ascii = '';
$len = strlen($str);
$a = 0;
while ($a < $len) {
$ud = 0;
if (ord($str[$a]) >= 0 && ord($str[$a]) <= 127) {
$ud = ord($str[$a]);
$a += 1;
} else if (ord($str[$a]) >= 192 && ord($str[$a]) <= 223) {
$ud = (ord($str[$a]) - 192) * 64 + (ord($str[$a + 1]) - 128);
$a += 2;
} else if (ord($str[$a]) >= 224 && ord($str[$a]) <= 239) {
$ud = (ord($str[$a]) - 224) * 4096 + (ord($str[$a + 1]) - 128) * 64 + (ord($str[$a + 2]) - 128);
$a += 3;
} else if (ord($str[$a]) >= 240 && ord($str[$a]) <= 247) {
$ud = (ord($str[$a]) - 240) * 262144 + (ord($str[$a + 1]) - 128) * 4096 + (ord($str[$a + 2]) - 128) * 64 + (ord($str[$a + 3]) - 128);
$a += 4;
} else if (ord($str[$a]) >= 248 && ord($str[$a]) <= 251) {
$ud = (ord($str[$a]) - 248) * 16777216 + (ord($str[$a + 1]) - 128) * 262144 + (ord($str[$a + 2]) - 128) * 4096 + (ord($str[$a + 3]) - 128) * 64 + (ord($str[$a + 4]) - 128);
$a += 5;
} else if (ord($str[$a]) >= 252 && ord($str[$a]) <= 253) {
$ud = (ord($str[$a]) - 252) * 1073741824 + (ord($str[$a + 1]) - 128) * 16777216 + (ord($str[$a + 2]) - 128) * 262144 + (ord($str[$a + 3]) - 128) * 4096 + (ord($str[$a + 4]) - 128) * 64 + (ord($str[$a + 5]) - 128);
$a += 6;
} else if (ord($str[$a]) >= 254 && ord($str[$a]) <= 255) {
$ud = false;
}
$ascii .= $prefix . $ud . ";";
}
return $ascii;
}
其实很简单,汉字的HTML实体由三部分组成,”&#+ASCII+;“ 即可。
例如,把“欢迎点赞收藏” 转换成“欢迎点赞收藏”
下面是php实现过程,喜欢的朋友可以点赞收藏哦
echo ascii_decode("黄瓜");
echo ascii_encode("黄瓜");
function ascii_decode($str, $prefix="&#") {
$string = '';
$str = str_replace($prefix, "", $str);
$strArr = explode(";", $str);
foreach ($strArr as $dec) {
if ($dec < 128) {
$string .= chr((int)str_replace($prefix,"",$dec));
} else if ($dec < 2048) {
$string .= chr(192 + (($dec - ($dec % 64)) / 64));
$string .= chr(128 + ($dec % 64));
} else {
$string .= chr(224 + (($dec - ($dec % 4096)) / 4096));
$string .= chr(128 + ((($dec % 4096) - ($dec % 64)) / 64));
$string .= chr(128 + ($dec % 64));
}
}
return $string;
}
function ascii_encode($str, $prefix = "&#") {
$ascii = '';
$len = strlen($str);
$a = 0;
while ($a < $len) {
$ud = 0;
if (ord($str[$a]) >= 0 && ord($str[$a]) <= 127) {
$ud = ord($str[$a]);
$a += 1;
} else if (ord($str[$a]) >= 192 && ord($str[$a]) <= 223) {
$ud = (ord($str[$a]) - 192) * 64 + (ord($str[$a + 1]) - 128);
$a += 2;
} else if (ord($str[$a]) >= 224 && ord($str[$a]) <= 239) {
$ud = (ord($str[$a]) - 224) * 4096 + (ord($str[$a + 1]) - 128) * 64 + (ord($str[$a + 2]) - 128);
$a += 3;
} else if (ord($str[$a]) >= 240 && ord($str[$a]) <= 247) {
$ud = (ord($str[$a]) - 240) * 262144 + (ord($str[$a + 1]) - 128) * 4096 + (ord($str[$a + 2]) - 128) * 64 + (ord($str[$a + 3]) - 128);
$a += 4;
} else if (ord($str[$a]) >= 248 && ord($str[$a]) <= 251) {
$ud = (ord($str[$a]) - 248) * 16777216 + (ord($str[$a + 1]) - 128) * 262144 + (ord($str[$a + 2]) - 128) * 4096 + (ord($str[$a + 3]) - 128) * 64 + (ord($str[$a + 4]) - 128);
$a += 5;
} else if (ord($str[$a]) >= 252 && ord($str[$a]) <= 253) {
$ud = (ord($str[$a]) - 252) * 1073741824 + (ord($str[$a + 1]) - 128) * 16777216 + (ord($str[$a + 2]) - 128) * 262144 + (ord($str[$a + 3]) - 128) * 4096 + (ord($str[$a + 4]) - 128) * 64 + (ord($str[$a + 5]) - 128);
$a += 6;
} else if (ord($str[$a]) >= 254 && ord($str[$a]) <= 255) {
$ud = false;
}
$ascii .= $prefix . $ud . ";";
}
return $ascii;
}
新闻资讯 更多
- 【建站知识】查询nginx日志状态码大于400的请求并打印整行04-03
- 【建站知识】Python中的logger和handler到底是个什么?04-03
- 【建站知识】python3拉勾网爬虫之(您操作太频繁,请稍后访问)04-03
- 【建站知识】xpath 获取meta里的keywords及description的方法04-03
- 【建站知识】python向上取整以50为界04-03
- 【建站知识】scrapy xpath遇见乱码解决04-03
- 【建站知识】scrapy爬取后中文乱码,解决word转为html 时cp1252编码问题04-03
- 【建站知识】scrapy采集—爬取中文乱码,gb2312转为utf-804-03