نحوه استفاده از BERT برای تجزیه و تحلیل میزان مرتبط بودن محتوای شما

چیزی که برای SEO ها مهم است که بفهمند این است که برای درک محتوای شما، گوگل باید آن را به یک مقدار عددی ترجمه کند. این تنها راهی است که موتورهای جستجو می توانند به طور موثر محتویات وب را در مقیاس درک کنند. این تبدیل از طریق آنچه “مدل جاسازی” نامیده می شود انجام می شود.

آنچه بسیار قدرتمند است این است که وقتی دو مجموعه متن را به مقادیر عددی تبدیل کردید، سپس می‌توانید «فاصله» بین آنها را اندازه‌گیری کنید (شباهت کسینوس). این یک نمایش ریاضی از نزدیکی هر مقدار متن به یکدیگر است. هرچه آنها نزدیکتر باشند، محتوا شبیه تر است و مرتبط تر است. در واقع، موتورهای جستجو مانند گوگل مستقیماً از Similarity استفاده می‌کنند تا بفهمند آیا یک صفحه به اندازه کافی با یک پرس و جو مطابقت دارد یا خیر.

در Go Fish Digital، ما اخیراً اسکریپت پایتون را ایجاد کرده‌ایم که به شما امکان می‌دهد از BERT برای محاسبه شباهت یک قطعه متن خاص برای یک کلمه کلیدی هدف استفاده کنید. این می تواند به شما یک نمایش ریاضی از ارتباط یا عدم مرتبط بودن محتوای شما با جستجوی هدف با استفاده از فناوری خود گوگل بدهد.

در اینجا نحوه استفاده از آن آمده است:

اسکریپت پایتون را در زیر دانلود کنید

در یک ویرایشگر متن، اسکریپت پایتون زیر را در جایی از رایانه خود کپی و جایگذاری کنید و نام آن را “BERT.py” بگذارید.

—————————

مشعل وارداتی
از واردات ترانسفورماتور BertTokenizer، BertModel
از sklearn.metrics.pairwise cosine_similarity وارد کنید

def get_embedding (متن، مدل، توکنایزر):
ورودی ها = نشانه ساز (متن، return_tensors='pt')
خروجی ها = مدل (**ورودی ها)
برگرداندن outputs.last_hidden_state.mean(dim=1).detach().numpy()

def main():
جمله = ورودی (“جمله: “)
کلمه کلیدی = ورودی (“کلمه کلیدی:”)

tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
model = BertModel.from_pretrained('bert-base-uncased')

sentence_embedding = get_embedding (جمله، مدل، توکنایزر)
keyword_embedding = get_embedding (کلمه کلیدی، مدل، توکنایزر)

# شباهت کسینوس را محاسبه کنید
شباهت_نمره = شباهت_کسینوس (جاسازی_جمله، جاسازی_کلید_کلید)[0][0]

# تعبیه‌ها را برای نمایش کوتاه کنید
sentence_embedding_truncated = جمله_embedding[0][:10]
keyword_embedding_truncated = keyword_embedding[0][:10]

چاپ (f”جمله: {جمله}”)
print(f”Embedding: {sentence_embedding_truncated.tolist()}…”)
چاپ (f”Keyword: {keyword}”)
print(f”Embedding: {keyword_embedding_truncated.tolist()}…”)
چاپ (f”امتیاز تشابه: {similarity_score:.4f}”)

اگر __name__ == “__اصلی__”:
main()


ترانسفورماتورها را در ترمینال خود نصب کنید

در مرحله بعد، باید کتابخانه Transformers را از Hugging Face نصب کنید. ترمینال خود را باز کنید و دستور زیر را اجرا کنید:

مشعل ترانسفورماتور نصب پیپ

BERT.py را اجرا کنید

در مرحله بعد می خواهید اسکریپت واقعی پایتون را اجرا کنید. در ترمینال خود، می خواهید به پوشه ای در دستگاه خود بروید که فایل را در آن ذخیره کرده اید. برای انجام این کار، می توانید روی فایل BERT.py خود کلیک راست کرده و سپس کلید “Option” را نگه دارید. گزینه ای برای “کپی به عنوان نام مسیر” را مشاهده خواهید کرد. شما می توانید از دستور “cd” برای تغییر دایرکتوری ها به نام مسیر استفاده کنید.

برای من از این دستور برای دسترسی به پوشه دانلودها استفاده کردم:

سی دی /کاربران/نام کاربری/دانلودها/

پس از آن، به سادگی با استفاده از دستور زیر، اسکریپت پایتون را اجرا خواهید کرد:

پایتون BERT.py

سپس از شما خواسته می شود که هم محتوایی را که می خواهید تجزیه و تحلیل کنید و هم کلمه کلیدی را که می خواهید با آن مقایسه کنید پر کنید. این اطلاعات را کپی کرده و در ترمینال قرار دهید.

امتیاز تشابه محتوای خود را تجزیه و تحلیل کنید

از آنجا، اسکریپت پایتون یک امتیاز تشابه در برابر پرس و جوی هدف در متریک «امتیاز شباهت» به دست می‌دهد. این یک امتیاز از 0 تا 1 در مورد ارتباط متن با پرس و جوی که وارد کرده اید خواهد بود.

اکنون این یک روش بسیار ساده برای درک میزان مرتبط بودن محتوای شما با یک جستجوی داده شده است. با این حال، حداقل برای قرار دادن یک مقدار عددی برای محتوای خود از نظر میزان هدفمندی آن برای جستجویی که می خواهید تجزیه و تحلیل کنید مفید است.

ابزارهای مشابه Go Fish Digital

در Go Fish Digital، ما در واقع برخی از برنامه‌های افزودنی کروم سفارشی ساخته‌ایم که می‌توانند این نوع تحلیل را برای هر بخش از محتوا در کل صفحه انجام دهند. این ابزار یک پرس و جوی ورودی می‌خواهد، هر بخش از محتوا را در یک صفحه خراش می‌دهد، شباهت را محاسبه می‌کند و سپس تمام بخش‌های تحلیل شده را امتیاز می‌دهد. در زیر می توانید پردازش شده را مشاهده کنید:

این بدان معنی است که برای کل صفحه، می توانید محتوای خود را بخش به بخش تجزیه و تحلیل کنید تا ببینید چه چیزی از نظر شباهت امتیاز بالایی دارد و چه چیزی نیست. همچنین می‌توانید این تجزیه و تحلیل را در صفحات رقیب اجرا کنید تا ببینید شکاف‌های احتمالی در کجا ممکن است وجود داشته باشد. ما در حال حاضر در حال اجرای نمایش‌های نمایشی در مورد نحوه عملکرد این ابزار برای هر سایت هستیم، بنابراین اگر می‌خواهید اطلاعات بیشتری کسب کنید، در تماس باشید.

اخبار را مستقیماً در صندوق ورودی خود جستجو کنید

*ضروری

Source link