为了账号安全,请及时绑定邮箱和手机立即绑定

php emoji utf8转unicode

标签:
PHP

/**

 * Translates a sequence of UTF-8 bytes to their equivalent unicode code points.

 * Each code point is prefixed with "\u".

 *

 * @param string $utf8

 *

 * @return string

 */function utf8_to_unicode($utf8) {

    $i = 0;

    $l = strlen($utf8);


    $out = '';


    while ($i < $l) {

        if ((ord($utf8[$i]) & 0x80) === 0x00) {

            // 0xxxxxxx

            $n = ord($utf8[$i++]);

        } elseif ((ord($utf8[$i]) & 0xE0) === 0xC0) {

            // 110xxxxx 10xxxxxx

            $n =

                ((ord($utf8[$i++]) & 0x1F) <<  6) |

                ((ord($utf8[$i++]) & 0x3F) <<  0)

            ;

        } elseif ((ord($utf8[$i]) & 0xF0) === 0xE0) {

            // 1110xxxx 10xxxxxx 10xxxxxx

            $n =

                ((ord($utf8[$i++]) & 0x0F) << 12) |

                ((ord($utf8[$i++]) & 0x3F) <<  6) |

                ((ord($utf8[$i++]) & 0x3F) <<  0)

            ;

        } elseif ((ord($utf8[$i]) & 0xF8) === 0xF0) {

            // 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

            $n =

                ((ord($utf8[$i++]) & 0x07) << 18) |

                ((ord($utf8[$i++]) & 0x3F) << 12) |

                ((ord($utf8[$i++]) & 0x3F) <<  6) |

                ((ord($utf8[$i++]) & 0x3F) <<  0)

            ;

        } elseif ((ord($utf8[$i]) & 0xFC) === 0xF8) {

            // 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

            $n =

                ((ord($utf8[$i++]) & 0x03) << 24) |

                ((ord($utf8[$i++]) & 0x3F) << 18) |

                ((ord($utf8[$i++]) & 0x3F) << 12) |

                ((ord($utf8[$i++]) & 0x3F) <<  6) |

                ((ord($utf8[$i++]) & 0x3F) <<  0)

            ;

        } elseif ((ord($utf8[$i]) & 0xFE) === 0xFC) {

            // 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

            $n =

                ((ord($utf8[$i++]) & 0x01) << 30) |

                ((ord($utf8[$i++]) & 0x3F) << 24) |

                ((ord($utf8[$i++]) & 0x3F) << 18) |

                ((ord($utf8[$i++]) & 0x3F) << 12) |

                ((ord($utf8[$i++]) & 0x3F) <<  6) |

                ((ord($utf8[$i++]) & 0x3F) <<  0)

            ;

        } else {

            throw new \Exception('Invalid utf-8 code point');

        }


        $n = strtoupper(dechex($n));

        $pad = strlen($n) <= 4 ? strlen($n) + strlen($n) %2 : 0;

        $n = str_pad($n, $pad, "0", STR_PAD_LEFT);


        $out .= sprintf("\u%s", $n);

    }


    return $out;}

点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消