Lịch sử phiên bản Page Content to Markdown - 2 phiên bản
Page Content to Markdown bởi Jared
Lịch sử phiên bản Page Content to Markdown - 2 phiên bản
Hãy cẩn thận với các phiên bản cũ! Các phiên bản này được hiển thị cho mục đích thử nghiệm và tham khảo.Bạn luôn luôn phải sử dụng phiên bản mới nhất của một tiện ích.
Phiên bản mới nhất
Phiên bản 1.0.1
Đã phát hành 12 Thg 05 2026 - 119,44 KBHoạt động với firefox 109.0 và lớn hơnFixed- General extractor picks the largest matching candidate per selector, not the first. On The Verge, the first <article> on a story page is a related-cards stub — first-match-wins picked it and returned empty markdown. Score every match by textContent.length and pick the largest qualifying candidate.
- Tighter content-significance threshold. Bump the hasSignificantContent floor to ≥3 <p> descendants and ≥500 chars of trimmed text. Rejects related-card grids that previously slipped through because their aggregated link text passed the old 50-char gate.
- SVG elements no longer crash Turndown mid-traversal. SVG className is a SVGAnimatedString, not a string; calling .toLowerCase() on it threw and Turndown returned '' for the whole page. Read class via getAttribute('class') throughout the converter, with a fallback to .baseVal for safety. Eliminates a silent empty-output failure mode on news sites that ship inline SVG icons.
- Visible junk inside the article body no longer ships through. Expanded the non-content substring regex with author-bio, author-card, byline-bio, topics-list, tags-list, tags-row, subscribe, affiliate, disclosure, disclaimer, share-row, share-icons, social-icons, related-articles, related-stories, read-more-cta, keep-reading, frequently-asked, faq-, further-reading, comments-section. Clears author-bio cards on TechCrunch / Tom's Guide, the trailing FAQ section on Mashable, and the end-of-post subscribe widget on Substack.
- Structural section rejector for related/topics/FAQ/subscribe blocks. Any <section> or <div> whose first heading (looking one level deep through a wrapper div) reads as Topics, Tags, Related…, Frequently Asked…, Further Reading, Read Next, Keep Reading, Recommended, or Subscribe to… gets rejected wholesale, regardless of class names. Catches framework-generated wrappers (mx-auto mt-12, pc-paddingTop-32) that didn't pattern-match before.
Mã nguồn được phát hành dưới dạng Giấy phép MIT
Phiên bản cũ hơn
Phiên bản 1.0.0
Đã phát hành 8 Thg 05 2026 - 115,92 KBHoạt động với firefox 109.0 và lớn hơnMã nguồn được phát hành dưới dạng Giấy phép MIT