我们可能会听到一句口头禅,即我们不应该在近现代的 Web 开发中使用 HTML 表格(Faulkner,2017)。 例如,W3C 建议:“不应将表格用作布局辅助工具”(W3C,2014)。 然而,HTML 表格是呈现结构化表格数据的完美解决方案(Collins,2017)。 许多 Web 应用程序仍然使用 HTML 表格来显示表格数据。 因此,研究 HTML 表格并从这些表格中提取数据是值得的。 某些工具(例如 Excel 和 Power BI)可以从 HTML 表中获取数据。 但是,我们经常需要一个程序化的解决方案来将数据存储在 SQL Server 数据库中。 具有有限 HTML 和网页抓取背景的 IT 专业人员想了解网页抓取的工作原理。 他们还希望使用适当的方法从 HTML 表中收集数据。
https://www.mssqltips.com/sqlservertip/7041/python-example-web-scraping-project