html 테그 제거 정규화 입니다. tag 제거할 String 값을 removeTag 에서 넣어주시며 return 값으로 tag가 제거된 String 값이 반환됩니다. 정규화을 공부하시고 사용하시면 더욱 효과적으로 사용 하실수 있습니다.

public String removeTag(String str){
    Matcher mat;  
    // script 처리
 Pattern script = Pattern.compile("&lt;(no)?script[^&gt;]*&gt;.*?<!--(no)?script-->",Pattern.DOTALL);  
    mat = script.matcher(str);  
    str = mat.replaceAll("");  
    // style 처리
    Pattern style = Pattern.compile("<style[^>]*&gt;.*",Pattern.DOTALL);  
    mat = style.matcher(str);  
    str = mat.replaceAll("");  
    // tag 처리
    Pattern tag = Pattern.compile("&lt;(\"[^\"]*\"|\'[^\']*\'|[^\'\"&gt;])*&gt;");  
    mat = tag.matcher(str);  
    str = mat.replaceAll("");  
    // ntag 처리
    Pattern ntag = Pattern.compile("&lt;\\w+\\s+[^&lt;]*\\s*&gt;");  
    mat = ntag.matcher(str);  
    str = mat.replaceAll("");  
    // entity ref 처리
    Pattern Eentity = Pattern.compile("&amp;[^;]+;");  
    mat = Eentity.matcher(str);  
    str = mat.replaceAll("");
     // whitespace 처리
   Pattern wspace = Pattern.compile("\\s\\s+");  
   mat = wspace.matcher(str);
    str = mat.replaceAll("");          
    return str ;
    }
</style[^>

+ Recent posts