移除Html 的Tag 完全手冊(Javascript,Java,C#,PHP)
移除Html的Tag 標籤,最近有需要用到,所以整理以下各語言相關的作法
Javascript:
function RemoveHTML( strText )
{
var regEx = /<[^>]*>/g;
return strText.replace(regEx, “”);
}
{
var regEx = /<[^>]*>/g;
return strText.replace(regEx, “”);
}
C# for .Net:
public string RemoveHTMLInServer(string in_HTML)
{
return Regex.Replace(in_HTML, “<(.|\n)*?>”, “”);
}
{
return Regex.Replace(in_HTML, “<(.|\n)*?>”, “”);
}
Java:
public String reFormat(String content) {
content = content.replaceAll(“(?is)\\s\\s”, ” “);
content = content.replaceAll(“(?is)</?br>”, “\n”);
content = content.replaceAll(“(?is)</?p>”, “\n”);
content = content.replaceAll(“(?is) ”, “”);
content = content.replaceAll(“(?is)</?[a-z][a-z0-9]*[^<>]*>”, “”);
content = content.replaceAll(“<!–/?.*–>”, “”);
content = content.replaceAll(“ ”, “”);
content = content.trim();
return content;
}
content = content.replaceAll(“(?is)\\s\\s”, ” “);
content = content.replaceAll(“(?is)</?br>”, “\n”);
content = content.replaceAll(“(?is)</?p>”, “\n”);
content = content.replaceAll(“(?is) ”, “”);
content = content.replaceAll(“(?is)</?[a-z][a-z0-9]*[^<>]*>”, “”);
content = content.replaceAll(“<!–/?.*–>”, “”);
content = content.replaceAll(“ ”, “”);
content = content.trim();
return content;
}
PHP:
函數strip_tags的功能是刪除html標記,他的第二個參數是一個保留的html標記列表
如:
只保留<b>則strip_tags($text,”<b>”)
只保留<b><br><p>則strip_tags($text,”<b><br><p>”)
如:
只保留<b>則strip_tags($text,”<b>”)
只保留<b><br><p>則strip_tags($text,”<b><br><p>”)
參考資料:
http://www.cnblogs.com/time-is-life/archive/2008/02/13/1067790.html
http://topic.csdn.net/t/20050221/16/3795604.html
可以嘗試使用CJHTML快速的remove刪除掉你的html沒有必要的標簽或是屬性。
http://cjhtml.citiar.com/
chrome線上商店
https://chrome.google.com/webstore/detail/cjhtml/ekcpokmjjfacpjjcpnkpdihjjpiphoph?hl=zh-TW&utm_source=chrome-ntp-launcher
[回應]
@Leon, 這是你寫的工具嗎? 不錯喔~^^
[回應]