例如,使用这个product,我们清楚地看到HTML代码头部的开放图形信息:
<Meta property="og:type" content="product" /> <Meta property="og:title" content="Backless Gray Lace Tulle Flower Girl Dress with Big Bow" /> <Meta property="og:description" content="This dress is made of high quality lace and tulle fabric; Unique Cross back with straight neckline in the front; Big ... Shop now use NYC2018 for 9% off TODAY!" /> <Meta property="og:url" content="http://www.princessly.com/backless-gray-lace-tulle-flower-girl-dress-with-big-bow.html" /> <Meta property="og:site_name" content="Princessly.com" /> <Meta property="og:price:amount" content="49.62" /> <Meta property="og:price:currency" content="USD" /> <Meta property="og:availability" content="instock" />
根据他们丰富的针脚要求here.在大约半年前我们首先在我们的网站实施它时,这一切都很好。不幸的是,由于某种原因,它在1个月前停止了工作。请参阅pin page.它不再显示这些丰富的引脚信息。
当我们尝试使用丰富的PIN验证器(https://developers.pinterest.com/tools/url-debugger/)的产品页面时,它是still NOT working,并且对于我们测试的每个网址都会给出此错误:
We were unable to retrieve any data from your URL.
像这样:http://www.princessly.com/pinterest_error.png
这不是一个非常有用的错误信息。我们不知道他们是否无法访问页面(http代码?空白页面或其他什么?),或者只是在那里找不到任何打开的图形信息。
我们尝试了一切网站管理员论坛,并寻求Pinterest官方支持,基本上没有帮助,除了给我们已经知道的文档,并指责我们的服务器阻止他们的机器人的访问,但在与我们的主机团队多次确认后,没有错误关于Pinterest.com访问我们的网站:
54.85.173.173 - - [11/Oct/2016:21:22:00 -0500] "GET /u-back-ivory-cotton-ruffle-neckline-flower-girl-dress.html HTTP/1.1" 200 22477 "-" "Pinterest/0.2 (+http://www.pinterest.com/)" 54.227.228.14 - - [11/Oct/2016:21:27:20 -0500] "GET /u-back-ivory-cotton-ruffle-neckline-flower-girl-dress.html HTTP/1.1" 200 22477 "-" "Pinterest/0.2 (+http://www.pinterest.com/)" 52.87.185.68 - - [11/Oct/2016:21:28:06 -0500] "GET /u-back-ivory-cotton-ruffle-neckline-flower-girl-dress.html HTTP/1.1" 200 22477 "-" "Pinterest/0.2 (+http://www.pinterest.com/)"
由于我们是女装产品商家,所以Pinterest的销售额相当不错。自从丰富的消失以来,我们看到收入大幅下降。我们相信这个问题在我们说话的时候会花费真正的钱。
我们绝望,认为我们应该在这里试试我们的运气。不确定这是否符合编程问题,但它确实涉及HTML和Open Graph的代码以及提供开发人员API的主要社交网络之一。
由于我们无法掌握Pinterest机器人以及它如何看待我们的页面,所以我们调试这个方法似乎有限。
任何想法如何发生和如何调试&修理它?任何Pinterest工作人员在这里可以提供一些洞察力?谢谢!
更新1
以下是我在Princessly.com的index.PHP记录的HTTP USER AGENTS,最近24小时包含“Pinterest”:http://www.princessly.com/Pinterest.txt
我的主持人WiredTree对我来说再好一点了。似乎Pinterest bots确实能够访问我的网站没有问题。
检查网站“princessly.com”的访问日志,我可以看到从“Pinterest”到网站“Princessly.com”的成功访问。请参阅日志中的代码段。
======
194.103.189.40 – – [15 / Nov / 2016:03:32:31 -0600]“GET /skin/frontend/default/forest_fashion/images/bkg_btn_sprite.png HTTP / 1.1”200 2503“http://www.princessly.com/skin/frontend/default/forest_fashion/css/styles.css”“Pinterest / 0.2 http://pinterest.com/ “@H_404_41@194.103.189.40 – – [15 / Nov / 2016:03:32:31 -0600]“GET /skin/frontend/default/forest_fashion/images/tabs_border.gif HTTP / 1.1”200 43“http://www.princessly.com/skin/frontend/default/forest_fashion/css/styles.css”“Pinterest / 0.2 http://pinterest.com/ “@H_404_41@194.103.189.40 – – [15 / Nov / 2016:03:32:31 -0600]“GET /skin/frontend/default/forest_fashion/images/pager_bg.gif HTTP / 1.1”200 102“http://www.princessly.com/skin/frontend/default/forest_fashion/css/styles.css”“Pinterest / 0.2 http://pinterest.com/ “
======
Is there any way I can find the name of the Pinterest bot That I can detect as HTTP USER AGENT?
从日志中我可以看到Pinterest bot标签是“Pinterest / 0.2 http://pinterest.com”。
- Can we know if the requests made by Pinterest bot timed out?
我检查了Apache日志中有哪些注册了Pinterest访问的IP地址,我找不到任何超时错误。
- How do we know if we block AWS requests?
检查我看不到网站“Princessly.com”的任何块规则设置。我检查了.htaccess文件和robots.txt文件的网站。我现在已经按照您提供的链接列出了AWS IP地址范围。
你现在可以查看细节,如果有任何用户面板的Pinterest或其他细节,让我们知道,以便我们可以深入挖掘。
更新2
根据@Mackan的建议,我创建了几个相同的裸机最小页面,彼此完全相同,并具有正确的开放图形信息,并将其上传到多个不同的站点。我正在录制访问该页面的所有PHP USER AGENT:
>与Princessly.com相同的服务器上的网站
Site IP: 173.199.151.128
070014
070015
– 失败
Site IP: 173.199.151.128
070016
070017
– 失败
Site IP: 173.199.151.130
070018
070019
– 失败
>与Princessly.com不同的服务器
070020
070021
– 成功
>另一个与Princessly.com不同的服务器
070022
070023
– 成功
在使用rich pin验证器进行测试后,似乎是服务器问题。该请求永远不会达到Princessly.com服务器上所有网站的PHP文件。
WiredTree的支持非常友善,帮助我找到罪魁祸首,但是在通过超过5名支持人员转移之后,迄今没有任何希望。我们已经经历了.htaccess,Apache conf,modSecurity,防火墙,whitelisting Pinterest IP,AWS IP等。没有任何工作。
这真的很奇怪。
更新3
即使weirder是,如果你看看http://www.princessly.com/Pinterest_agents.txt你可以看到有INDEFED条目“Pinterest / 0.2(http://www.pinterest.com/)”那里。
但是,如果你给它一个manual test,它失败,不记录访问。
这似乎是断断续续地,也许。
这是在量子物理领域,我不知道该怎么做,除了最后的手段是订购和配置一个新的服务器,并迁移Princessly.com看看它是怎么回事。
你的想法?
解决方法
If you’re seeing We weren’t able to retrieve any data from your URL,@H_404_41@ then Pinterest may be timing out before we can create a Pin on your@H_404_41@ site. Unfortunately,this isn’t something we can fix on our end,and@H_404_41@ usually happens when a site is slow. This error also appears if your@H_404_41@ site blocks Amazon Web Services (AWS) requests. You’ll have to remove@H_404_41@ this block before applying for Rich Pins.
创建一些“最小但工作”的页面,并通过验证器运行它们使问题更清楚,但不幸的是没有解决。这是本地服务器(Apache)的问题,或者是pinterest bot的问题。
Pinterest bot似乎打到了服务器,但验证器无法解析或到达端点。由于最小的示例返回 – 不到一秒钟,并且包含一个最低限度以满足Pinterest的要求,很明显,该问题不在您的代码中。
编辑
新主机似乎工作得更好(使用最小例子之一):@H_404_41@