The Different Types of Formula-based Content


There have been  comparatively few articles written in the mainstream SEO blogs about creating content based on formulas – the only folks that seem to cover this topic tend to be from the seedy underside of affiliate marketing, under the term “article spinning”.  David Leonhardt’s recent article (more reputable I think), gives some good examples of what the practice entails.

There are various tools available for “spinning” content, but depending on the business goals and approach, the various methods have different tradeoffs.  Pursuing a formula-based content strategy in order to attract traffic is often unadvisable due to the probability of detection (and potential ranking penalties), and should be approached only with a high degree of caution.

Google has a technology for near-duplicate detection available to them called “Simhash“, which has been published on extensively in the literature (and Google has even openly presented on it in the academic community).  When Google presents on something and casually talks about applying it to trillions of documents, that usually means – it’s key to their search capability.

The Simhash algorithm essentially breaks documents into tiny pieces, then compares how many of the pieces are identical – in a way that is highly resistant to fooling; even if you move pieces of sentences around so the documents are in different orders,  it can still detect that the two documents are similar.  Simhash isn’t perfect, and Google doubtless has additional and more sophisticated algorithms now, but it’s instructive in that it illustrates you can’t just change one thing about a document and think “OK, that’s not a duplicate now” – in fact, it’s a near-duplicate and will likely be detected.

In this light, we’ll outline the various approaches to forumula-based content generation, and the benefits and shortcomings of each.


Definition – Rewriting an entire article on “salsa dancing”, to create three different versions of it, for use on multiple websites, or to refresh a version on one website.  This technique is also known as “article rewriting”, and is probably most used by folks doing submitting articles to “article directories” – usually for the purpose of obtaining a backlink (embedded in the article).


  • Can survive even a “human review”.
  • Content retains all the value-add for users of the original version.
  • Easy to implement- articles can be re-written by unsophisticated writers and then corrected by a more expensive editor.


  • Expensive to rewrite entire articles multiple times.


Definition – Creating content with multiple versions of paragraphs that can be swapped in and out or combined to make multiple versions of pages.


  • Can mix and match multiple versions of pages to make even more versions.
  • Content retains all the value-add for users of the original version.


  • If generating many versions, the probability of several versions being very similar grows, still posing some detection problems.  It’s important to note that uniqueness is not enough – pages must be sufficiently dissimilar.
  • Two pages that are 90% the same are probably as likely to be detected as two pages that are 100% the same.


Definition – Similar to paragraph-level, but mixing and matching individual sentences to make each paragraph.


  • Can create a much large number of pages with this technique.


  • While paragraphs are fairly easy to rewrite, and they often need not say exactly the same thing; at the sentence level it begins to become much harder to say the same thing many different ways.   As a result the writing is more difficult and tends to read much more blandly.
  • If you generate a large number of pages, remember that statistically, the more you make, the more situations will arise where two pages, although not perfect duplicates, are very close near-duplicates.


Definition – Constructing individual sentences from snippets.  For example:

[Are you interested in|Were you thinking about]
[purchasing a pink elephant using a credit card|making a red bracelet with your own hands]
[for that special someone on their birthday?|for your dear old Auntie for Christmas?].

The various combinations in this case would add up to 8 versions of this sentence.


  • Can create even more versions of content than sentence level.
  • Theoretically more resistant to being classified by a search engine as “duplicate” content.


  • Value-add for end-users starts to drop rapidly, it’s hard to mix subsentences and still actually say something interesting and useful.
  • No consensus in industry on what threshold of similarity is acceptable.
  • Easy to do the math on how many combinations you are making, but difficult to take into account how many will be what percent similar and so on.


Definition – Going all the way down to having different versions of every word.  Also referred to as “article spinning”; there are a number of programs commercially available that apply synonyms to each word to generate multiple versions of an article, then allow you to edit to make the versions more readable.


  • Can create amazing amounts of content from the tiniest bit of actual material.


  • Extremely difficult to actually say something useful to users; typically results in high bounce rate and lower SERP rankings.
  • Requires extremely high level of expertise in the English language and extreme creativity to even attempt this.
  • Simply substituting synonyms does not work in many cases and requires extensive investment in editing after the content is generated.

This table summarizes the various difficulty levels and other attributes as I see them:

Type Difficulty Value-add to end-user Scalability Likelihood of Detection
Page-level 1 10 2 1
Paragraph-level 2 8 16 8
Sentence-level 4 6 256 4
Sub-sentence-level 16 4 4096 2
Word-level 32 2 65536 1


The best advice is, keep it simple – stick to page-level, which is also known as “article rewriting”.   If you are hell-bent on generating a lot of content with formulas, think about subsentence-level, or even consider mixing it up and doing a hybrid model – swap some paragraphs, sentences, and some subsentence-level content around.  If your goal is to keep your content fresh by refreshing titles, meta-descriptions, and so on using formulas, more power to you…but please don’t use formulas to generate tons of useless garbage – remember, as Peter Parker’s uncle said, with great power comes great responsibility!


  1. Marcus M says:

    Hi. For lot’s of people writing articles can be a stressful job, so I discover this great software to create original content in just few minutes and to spin my articles. This is pretty cool. You can check here:

  2. Mark F. says:

    Marcus M… could you be a spammer?

  3. Ted Ives says:

    Hmm…I’m going to step out there and say, just maybe!

    Akismet caught Marcus’s comment but I went ahead and approved it anyway, because it’s actually related to the topic, and also for his pure unadulterated moxie in spamming a fellow SEO person’s blog so blatantly!

    Come get your PageRank, all you article spinner software people! 😉

  4. 司会者に対しては言及比較スイス先進の時計を持って産業チェーンでは、フランスは一セットの完璧な人材を育成するメカニズムに肖晓は「今年バーゼル時計展が終わった後、私たちの時間を割いて行くフランスを見学しましたフランス独立時計ブランドPequignetのタブ工房、距離スイスのタブセンターを紹徳封遠くない通りすがりの時計学院、ちょうどランチタイム、相対的に人口過疎ヨーロッパ山岳地帯、学院の入り口に集結した非常に多くの学生。スーパーコピーブランドバッグ明らかに、フランスタブ業セット完備、厳格な時計職業訓練システム、フランス時計業を提供する固体人材備蓄後ろ盾ので、時計人材育成面ではないフランス劣勢の。」

  5. の原則は原則の詩と経済学の原則で、第2の「等価。ここでは、まあposited実用方程式の間です。「いい」、「次」と「既成事実」。PAS(良いと深刻な自制、自制、自制)。」準配備本もろくて弱い経済方程式、探求の境界の間の過程と製品、成功と失敗、天才と。ロレックス 時計コピー「なくて、私達のここだけの話しましょう、私達に引き続き気づいた、このタイプの反復件1。

  6. 口径52850自動運動性能で印象的です、そして、その見える間、それはかなり大きいです、それはそれへのより多くのフィットをより簡単にします。大きな運動を好む人々は今日、しかし、大部分の失敗はある意味ではそれはブランドのために不正行為をしていることを考慮する。カルティエスーパーコピーどんな腕時計会社は、20世紀に苦労しました、より小さくて動きをつくる機械システムの小型化の程度。大型の運動における空間の合併症の多くを含む多くのことをより簡単にします。多くの方法においては、は、いくつかの小さな懐中時計の動きと同じサイズです。おそらく、これはなぜ簡単に素晴らしいが168時間パワーリザーブのを取得することです(1週間)、まだ4運動の速度で動作している。

  7. 財布のコピー 時間を発表しますとても長くてとても長い前、人類はすべて更に赤く双足は歩いています。1人の国王はある辺鄙で遠い田舎の旅行に着いて、路面がでこぼこなため、とても多くてばらばらな石があって、刺すのは彼の足を得ます痛くてしびれます。王宮に帰った後に、彼はおりていっしょに命令して、国内のすべての道はすべて一層のほらに敷きます。彼はこのようにすると思って、自分になって、また彼の人民に幸福をもたらすことができて、みんなを歩かせます時もう受けて痛い苦しみを刺しません。たとえしかし最も国内のすべての牛を殺しますとしても、十分な皮革をも調達しきれないで、費やした金銭、使用する人力、更にはかりしれません。まったくできないが、甚だしきに至ってはまたかなり愚かで、しかし国王の命令なため、みんなも頭を振ってため息をつくことしかできません。1人の聡明な召使いは大胆に国王に提案を出しています:「国王!どうしてあなたは大勢の人を動員して、そんなに多い牛に命を捧げて、そんなに多い金銭を費やしますか?あなたは何は両の小さいほらであなたの足をしっかり包むだけではありませんか?」国王が聞いたのはとても驚いて、しかしもすぐ悟って、そこですぐに命令を取り消して、この提案を新たに採用します。聞くところによると、これは「革靴」の由来です。世界を変えたくて、難しいです;自分を変えて、比較的容易です。全世界を変えるよりも、先に自分の–「自分の双足を包みます」を変えるほうがいいです。自分のいくつかの観念と方法を変えて、外来の侵略を防ぎ止めますで。自分で変えた後に、目の中の世界の自然はすぐ引き続き変えました。

  8. 数ヶ月前、私が読んだ(よく聞いて、実際に感謝して、聞き取れる)と呼ばれ、火星人は本当にクールな本(アンディ・堰によって書かれる)の後で知りましたが、私は「メジャー映画について「というのは、聞きます、私はリドリー・スコットメジャー映画になる空間を含むによって何を考える。マット・デイモンの性格は、リードという名のマークwatney、脚本と明らかに、彼は火星の映画の少なくとも一部においてハミルトン腕時計を着そうです。

  9. iwcのシャフハウゼンはちょうど最近リリースされた彼らの第3の新しいモデルは、ポルトガルのラインアップで、エレガントなスタイルの旅行・クラシックで、冒険の愛を結合すること。スーパーコピーブランド最新モデルの2つの主要な機能だという手巻8日間としての当て推量を残します。

  10. スイスガス針表最新アルバムのファルガーのシリーズの製品は、イギリス民族英雄ネルソン将軍の勇敢事績をデザインコンセプトは、トラファルガー広場をデザインについて、設計新しいファルガーシリーズの腕時計。上品で優雅なエレガントな文字盤、白黒の色調はファッション個性を強調し、シンプルな。表面の目盛りが放射状に合わせて中心、剣の形の指針と無限活力。IWC偽物全精鋼ケース、透視表の底。またステンレスベルトや高級革バンド選べ、ステンレスベルトを手の設計、快適なファッション、覇気丈夫、落ち着いて英知、解釈に新しい生活の理念。

  11. 私にとっては、2015年年間カレンダーiwcの腕時計の最も印象的な要素の運動である。オメガスーパーコピー後に大44.2mmワイドケースと、広大なサファイアクリスタル窓を通して、あなたは近代的な機械の腕時計運動の自社製キャリバー52850 iwcの素晴らしい例であることを見ます。iwcの米国の運動のアーキテクチャの範囲内で種々の谷と山の深い見方を与えることは素晴らしい仕事をしました。と運動を取り上げた事例の多くは、大きなプラスである。

  12. ルイヴィトンコピー 偽物激安ヴィトンコピー 販売階のほらを輸入する資格があって、全国の第一項のナイロンのふろしき包みは傲慢なシリーズの女性を配合して包んで、高級で派手で、私達はただふろしき包みの中のハイエンドのブランドだけをしま。ハイエンドのファスナー、私達の採用の高級なファスナーは大工場のOEMからで、ファスナーが順調で滑るのは丈夫で、高品質と高享受。

  13. 私たちは何を感知時間、世界を感じるのですか?毎日明け方に一筋の光が窓、目を開けた瞬間、私たちの視線に入る光は、光で週囲のすべてを感知して。光のは無料では貴重な、唯美の。シャネル バッグコピー光の力をブルガリBVLGARIで霊感を構築し、新しいLVCEAレディース腕時計シリーズ。LVCEAシリーズは日時計の挨拶、それは歴史を煥発新顔、抜群性能とアイデアの設計の完全な統合。円形のケース、しなやかなベース、一連の光とスタイルのような風にLVCEA捏ねる華中、強調のユニークな個性魅力。

Leave a Reply

Pingbacks & Trackbacks

  1. Tweets that mention The Different Types of Formula-Based Content | Coconut Headphones -- - Pingback on 2011/01/24
  2. Tweets that mention The Different Types of Formula-Based Content | Coconut Headphones -- - Pingback on 2011/01/24