为了账号安全,请及时绑定邮箱和手机立即绑定

如何在Android中剥离或转义html标签

如何在Android中剥离或转义html标签

梦里花落0921 2019-10-28 15:45:34
PHP具有strip_tags从字符串中剥离HTML和PHP标签的功能。Android是否有逃脱html的方法?
查看完整描述

3 回答

?
catspeake

TA贡献1111条经验 获得超0个赞

链接到的答案中的解决方案通常需要使用正则表达式(这是一种容易出错的方法),或者安装第三方库(例如jsoup或jericho)。在Android设备上更好的解决方案是仅使用Html.fromHtml()函数:


public String stripHtml(String html) {

    if (android.os.Build.VERSION.SDK_INT >= android.os.Build.VERSION_CODES.N) {

       return Html.fromHtml(html, Html.FROM_HTML_MODE_LEGACY).toString();

    } else {

       return Html.fromHtml(html).toString();

    }

}

这使用Android内置的HTML解析器来构建Spanned没有任何html标签的输入html 的表示形式。然后,通过将输出转换回字符串来剥离“ Span”标记。


随着讨论这里,Html.fromHtml行为已经改变,因为Android的N.请参阅文档获取更多信息。


查看完整回答
反对 回复 2019-10-28
?
aluckdog

TA贡献1847条经验 获得超7个赞

不好意思,我认为这对其他人可能会有所帮助,


只需删除html条


Html.fromHtml(htmltext).toString()

这样,html标记将被替换为字符串,但是字符串的格式将不正确。因此我做到了


Html.fromHtml(htmltext).toString().replaceAll("\n", "").trim()

这样,我首先用具有空格的nextline替换并删除了空格。同样,您可以删除其他人。


查看完整回答
反对 回复 2019-10-28
?
尚方宝剑之说

TA贡献1788条经验 获得超4个赞

Html.escapeHtml(String)如果您定位的是API 16或更高版本,则可以选择使用。


对于也在API 16以下定位的对象,您可以改为调用以下类,HtmlUtils.escapeHtml(String)而我只是从源代码中拉出该类Html.escapeHtml(String)。


public class HtmlUtils {


    public static String escapeHtml(CharSequence text) {

        StringBuilder out = new StringBuilder();

        withinStyle(out, text, 0, text.length());

        return out.toString();

    }


    private static void withinStyle(StringBuilder out, CharSequence text,

                                    int start, int end) {

        for (int i = start; i < end; i++) {

            char c = text.charAt(i);


            if (c == '<') {

                out.append("&lt;");

            } else if (c == '>') {

                out.append("&gt;");

            } else if (c == '&') {

                out.append("&amp;");

            } else if (c >= 0xD800 && c <= 0xDFFF) {

                if (c < 0xDC00 && i + 1 < end) {

                    char d = text.charAt(i + 1);

                    if (d >= 0xDC00 && d <= 0xDFFF) {

                        i++;

                        int codepoint = 0x010000 | (int) c - 0xD800 << 10 | (int) d - 0xDC00;

                        out.append("&#").append(codepoint).append(";");

                    }

                }

            } else if (c > 0x7E || c < ' ') {

                out.append("&#").append((int) c).append(";");

            } else if (c == ' ') {

                while (i + 1 < end && text.charAt(i + 1) == ' ') {

                    out.append("&nbsp;");

                    i++;

                }


                out.append(' ');

            } else {

                out.append(c);

            }

        }

    }

}

我正在使用这个效果很好的课程。


查看完整回答
反对 回复 2019-10-28
  • 3 回答
  • 0 关注
  • 936 浏览

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信