什么是urllib?
urllib是可用于打开URL的Python模块。 它定义了有助于URL操作的函数和类。
使用Python,您还可以从Internet访问和检索XML,HTML,JSON等数据。您也可以使用Python直接处理此数据。 在本教程中,我们将看到如何从Web检索数据。 例如,在这里我们使用了guru99视频URL,我们将使用Python以及该URL的打印HTML文件访问该视频URL。
如何使用Urllib打开URL
在运行代码以连接到Internet数据之前,我们需要导入URL库模块或“ urllib”的语句。
导入urllib
- 定义您的主函数
- 声明变量webUrl
- 然后在URL库上调用urlopen函数
- 我们打开的URL是youtube上的guru99教程
- 接下来,我们将打印结果代码
- 通过在我们创建的webUrl变量上调用getcode函数来检索结果代码
- 我们将其转换为字符串,以便可以将其与我们的字符串“结果代码”串联
- 这将是常规的HTTP代码“ 200”,指示http请求已成功处理
如何在Python中获取HTML文件形式的URL
您还可以使用Python中的“read function”来读取HTML文件,并且在运行代码时,HTML文件将出现在控制台中。
- 在webURL变量上调用read函数
- 读取变量允许读取数据文件的内容
- 将URL的全部内容读入一个名为data的变量中
- 运行代码-它将数据打印为HTML格式
这是完整的代码
Python 2 Example
#
# read the data from the URL and print it
#
import urllib2
def main():
# open a connection to a URL using urllib2
webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")
#get the result code and print it
print "result code: " + str(webUrl.getcode())
# read the data from the URL and print it
data = webUrl.read()
print data
if __name__ == "__main__":
main()
Python 3 Example
#
# read the data from the URL and print it
#
import urllib.request
# open a connection to a URL using urllib
webUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')
#get the result code and print it
print ("result code: " + str(webUrl.getcode()))
# read the data from the URL and print it
data = webUrl.read()
print (data)